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1.1. DELIMITĂRI CONCEPTUALE 


1.1.1. PSIHODIAGNOZĂ ŞI EVALUARE PSIHOLOGICĂ 


Evaluarea psihologică este un set de proceduri utilizate de psiholog cu scopuri care includ, în 
general: 

1. Producerea de imagini (evaluarea ca suport pentru a dezvolta descrieri şi imagini despre o 
anumită persoană, privind funcțiunile intelectuale, trăsăturile de personalitate, aptitudinile 
speciale, dificultăţile de învăţare, variabile emoţionale şi sociale). 

2. Producerea de decizii (evaluarea persoanei are ca finalitate producerea de decizii despre relația 
acelei persoane cu mediul ei actual sau cu mediile posibile: adecvare, normalitate, 
functionalitate, disfunctionalitate); 

3. Verificarea de ipoteze, construirea unei teorii (evaluarea ca suport pentru testarea ipotezelor 
despre personalitate). 


Psihodiagnoza este activitatea specifică ce foloseşte diferite tipuri de instrumente pentru a obţine 
informaţii despre structura, dinamica psihică şi personalitatea unei persoane. Astfel de instrumente 
utilizate sunt: testul psihologic; alte metode precum observaţia comportamentului verbal sau non- 
verbal, interviul. 

După unii autori în ceea ce priveşte delimitările între evaluarea psihologică şi psihodiagnoză 
nu sunt consacrate şi clare în literatura de specialitate. Spre exemplu evaluarea psihologică este 
considerată a avea mai degrabă o dominată calitativă, în timp ce psihodiagnoza este predominat 
cantitativă( Mitrofan, N. 2007). 

În ceea ce urmează vom delimita accepțiunea clasică a psihodiagnozei de cea modernă. 


Criteriile psihodiagnosticului traditional mai ales sub aspectul psihometriei clasice se referă la: 

e natura standardizată a testelor aptitudinale 

e intervenţia minimală a examinatorului astfel incat subiectul sa recurga numai la propriile 
resurse intelectuale 

e sistemul de evaluare se opreste la nivelul comunicarii rezultatelor ca atare, intrtun mod 
artificial 

e examinarea sub forma unui interviu in care subiectul nu este informat despre pertinenta 
răspunsurilor sale 

e eventualele încurajări premise de standardizare au o scăzută autenticitate, pentru că nu implica 
valoarea răspunsului ci urmăresc doar obținerea unei atitudini positive a subiectului fata de 
situaţia de testare 

e condițiile testării sunt identice pentru toți subiecţii, deşi nu toţi sunt pregătiţi pentru a se adapta 
la acestea(unii se acomodează mai greu cu interacțiunea limitativa şi nu pot profita autentic de 
acest tip de relaţie cu psihologul); unii dintre subiecţi au o eficienţă semnificativ crescută dacă 
primesc întăriri positive şi/sau repetate, în timp ce alţii nu sunt influenţaţi de astfel de conduite 


Evoluţii în psihodiagnoza modernă 
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In anii 60 ai secolului XX a apărut curentul cunoscut sub numele de evaluarea comportamentală, 
care încearcă să determine ce anume fac persoanele, unde, cînd şi în ce circumstanţe. 
În evaluarea şi predicția comportamentului se porneşte în primul rînd de la comportamentul motor si 
verbal manifest şi se renunță la interpretarea rezultatelor la teste. Evaluarea de tip comportamental se 
delimitează de evaluarea psihometrică atît în privinţa scopului cit şi în privinţa metodelor şi 
principiilor implicate(Fernandez- Ballesteros, 1993). 
Principiile evaluarii comportamentale sunt: 
e Conceperea observării ca metodă principală de măsurare 
e  Abandonarea chestionarelor de personalitate- acestea fiind considerate incapabile să descrie 
probabilitatea răspunsurilor comportamentale sau variabilele care afecteaza aceste raspunsuri 
e  Renunţarea la testele tradiționale care evaluează trăsături psihice precum structurile mentale 
e  Renunţarea la principiile psihometrice ale testelor 
Abordări prezente ale evaluării comportamentale subliniază necesitatea de a se lucra şi în noul cadru 
teoretic cu instrumente corespunzătoare ca fidelitate şi validitate, verificate psihometric, deşi inițial 
curentul a pornit cu negarea psihometriei şi a necesităţilor metrologice serioase. Astfel continuă să fie 
aplicate testele psihologice, ca si chestionarele de personalitate, mai ales cele care privesc factorii de 
influenţa ai comportamentului ce nu pot fi observați direct, precum motivaţia. 
e Au fost create metode şi instrumente proprii de măsurare: 
o Tehnici de observare 
o Proceduri fiziologice 
o Interviuri structurate 
o Tipuri noi de scale de evaluare de către alte persoane 


Analizînd modelele utilizate de evaluarea comportamentală, D.J. Cone, în 1986 (Silva, 1993) găseşte 
doar două mari categorii, care le subsumează pe toate celelalte, şi anume abordarea nomotetică a 
trăsăturii, şi abordarea idiografică a comportamentului. 

Abordarea nomotetică a trasăturii- are ca obiect de studiu trăsături sau sindroame(cum ar fi 
anxietatea socială, depresia, agorafobia), şi dezvoltă instrumente pentru deducerea acestora. În acest 
model instrumentul este adecvat dacă scorurile între indivizi variază, adică dacă diferenţiază între 
indivizi privind aceeaşi trăsătură. Ideea de baza este că orice trăsătură este universal aplicabilă tuturor 
persoanelor şi în consecinţă se încearcă predicția comportamentului prin măsurarea trasăturilor. 
Capacitatea de predictie mică a acestor instrumente provine din realitatea că fiecare persoană are 
trasături relevante care-i influențează comportamentul. Dacă trasăturile măsurate de test nu sunt 
relevante atunci nu poate fi facută o predictie bună a comportamentului(Paunonen, Jackson, 1985). În 
abordarea nomotetică se caută legile generale sau ecuaţiile care se aplică tuturor persoanelor. 
Procedura statistică preferată este analiza de regresie, adică identificarea funcţiei de regresie care leagă 
predictorul — trăsătura de personalitate- de criteriu- comportamentul specific. Pentru obţinerea ecuaţiei 
de regresie se utilizează date culese pe un eşantion, iar ecuaţia serveşte la predicția comportamentului 
tuturor indivizilor din populaţia din care a fost selectat eşantionul. Abordarea nomotetică a trăsăturii 
defineşte de fapt concepţia care stă la baza evaluării psihodiagnostice traditionale(Silva, 1993). 
Abordarea idiografică a comportamentului- studiază un comportament specific şi dezvoltă 
procedee pentru evaluarea sa inductivă. O procedură este considerată adecvată tinind cont de variația 
scorurilor la acelaşi individ. Ideea de bază este că fiecărei persoane îi sunt specifice anumite 
determinante ale comportamentului şi pe acestea încearcă să le identifice, sub forma ecuaţiilor proprii 
fiecărui individ. În acest context teoretic şi metodologic se identifică persoanele pentru care este 
potrivită o anumită ecuaţie de predictie a comportamentului pe baza trăsăturii. 


Deosebirea principală dintre evaluarea psihometrică şi cea comportamentală constă din presupunerea 
asupra comportamentului unei persoane. 

În teoria psihometrică scorul obţinut la un test este considerat a fi compus dintr-un scor real şi o eroare 
care provine din măsurare. Scorul real reflectă o entitate internă stabilă, deci nu se schimbă, cel puţin 
într-un interval scurt de timp, iar dacă apare o modificare de scor la test aceasta provine din eroarea de 


4 


Bazele teoretice ale evaluarii psihologice- Rezumat 


măsurare. Un test este considerat bun dacă scorurile obținute de o persoană la măsurări succesive nu 
diferă prea mult. Această calitate a testului se numeşte fidelitate. Comportamentul este considerat a fi 
dependent în primul rînd de o entitate internă stabilă- trăsătura. 

În concepţia evaluării comportamentale, comportamentul nu este, în mod necesar stabil. Dacă 
scorurile unei persoane la acelaşi test diferă se consideră că aceasta se poate datora chiar schimbărilor 
de comportament, nu neapărat impreciziei instrumentului de măsură. Cînd apelează la teste, evaluarea 
comportamentală caută să determine variabilele responsabile şi nu face nici o presupunere asupra 
erorii de măsurare. Deoarece susține dependenţa de situație a comportamentului evaluarea 
comportamentală nu utilizează validarea concurentă ca mijloc de predictie şi nici nu pretinde valori 
mari ale coeficientului de fidelitate test-retest. 


1.1.2. CONCEPTE CHEIE: EXAMEN PSIHOLOGIC, INSTRUMENT PSIHOLOGIC, 
OBSERVAȚIA IN EXAMENUL PSIHOLOGIC, CONDUITA EXAMINATORULUI 


Examen psihologic 
Orice examen psihologic implică următoarele aspecte comune: 

e Relaţia între examinator şi examinat(subiectul examinării) 

e Evaluarea rezultatelor subiectului de către examinator 

e Comportamentul examinatorului 

e Calitățile specifice ale sarcinii 
Deşi este o interrelatie între două persoane în care ambele caută informaţii, oferă şi primesc feedback, 
scopul specific al testării este de a informa examinatorul. Acesta va genera o serie de ipoteze despre 
modul cum funcționează subiectul într-un număr de situaţii sau interacțiuni diferite. Factorii care pot 
influenţa sistematic informaţiile sunt clasificați in doa categorii: factori care tin de metodologia de 
testare(metoda de testare, secvența de prezentare a testului sau testelor) şi factori care tin de 
examinator(personalitate, trebuinte, caracteristici psihofizice). Printre variabilele studiate şi descrise 
în literature de specialitate referitor la examinator se regăsesc: 

e Caracteristicile fizice ale examinatorului 
Prezenta-absenta acestuia în sala de testare 
Comportamentul sau’’cald” sau “rece” 
Conditionarea operată asupra comportamentului verbal al subiectului 
Efectul examinatorului ca persoană în afara evaluării personalităţii sale 

e Efectul examinatorului ca persoană cu evaluarea personalităţii sale 
Subiectul reacționează nu numai la stimulii pe care-i reprezită testul ci şi la toți ceilalți stimuli care-l 
înconjoară, deci la stimuli relevanti pentru testare dar şi la stimuli nerelevanti. Produsele subiectului 
sunt astfel un rezultat al reacțiilor sale particulare la itemii testului şi la examinator, ca întreg. 
Administrarea testelor de către examinatori diferiți în aceeaşi situaţie, sau de către acelaşi examinator 
dar în situaţii diferite poate conduce la rezultate diferite. Printre variabilele care afectează implicarea 
subiectului regăsim setul subiectiv, clasa socială a subiectului şi stresul situational. O altă sursă de 
eroare, legată de posibilitatea interpretării eronate, este constituită tocmai de faptul că examinatorul 
trebuie să ia decizii privind răspunsurile subiectului. Examinatorul poate interpreta eronat datorită 
perceptiilor sale subiective, caracteristicilor sale de personalitate sau chiar cunoaşterii limitate a valorii 
stimulului de către subiect. Studiile au constatat tendinţa examinatorilor de a examina diferit 
protocoalele testelor proiective şi în funcţie de clasa socială a subiectului (pentru protocoale în esenţă 
similare cei din clasa de jos au primit interpretări mai nefavorabile decât cei din clasa de mijloc). 


Forme ale examenului psihologic 
Cel mai important criteriu, obiectivul şi gradul de formalizare, clasifică examenele psihologice în două 
extreme: 
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1. Examenul psihometric 
2. Examenul clinic 


Examenul psihometric are principii şi metodologie foarte formalizată, şi care pornesc de la definiţia lui 
E.L. Thorndike: “Dacă un lucru există, xistenta sa are o anumită măsură cantitativă”. În consecinţa 
psihologia se ocupă cu trăsături distincte, care au o existenţa reală, şi pe care le posedă toți oamenii în 
măsuri diferite. Examenul psihometric caută să măsoare aceste trăsături reale. 


Examenul clinic se deosebeşte în primul rând printr-un accent mult scăzut pe aspectul formal şi mult 
mai mare pe problemele caracteristice, specifice celui examinat. 

Atât în privința calităților psihometrice, a standardizării cat şi a gradului de deschidere fata de 
specificul subiectului examinat foarte multe aspecte ale instrumentelor psihologice se leagă de 
dihotomozarea examinării în formală şi deschisă. 

Totuşi există multe forme mixte datorită diversităţii scopurilor şi situaţiilor care cer examinare. 

Cea mai formalizată situaţie dintre toate este reprezentată de examenul de selecție, în privinţa 
condiţiilor de examinare, a administrării probelor, a interpretării acestora. Fiecare probă este inclusă 
într-o baterie şi are o anumită pondere, precis calculată, în diagnoza sau predicția performanţei în 
anumite tipuri de cerinţe profesionale. 

În alte situaţii, spre exemplu consiliere educaţională, de cuplu, de carieră- probele sunt înalt 
standardizate, însă interpretarea este mai centrată pe nevoile clientului, deci mai puţin standardizată. 
Pot fi incluse şi probe mai puţin standardizate, iar interviul este mai puţin formalizat. 


Instrument psihologic 
Un instrument psihologic este o procedură sistematică de a evalua comportamentul uneia sau mai 
multor persoane. Caracteristicile profesionale ale testului ca instrument de evaluare sunt obiectivitatea 
şi standardizarea. 
Standardizarea 
Un instrument de măsură profesionist trebuie să evalueze într-un mod precis, standardizat, pe o scală 
de unități egale. Standardizarea se referă şi la procedura de lucru, procedura de înregistrare a 
rezultatelor, cotarea rezultatelor şi interpretarea acestora. Orice condiţii care afectează performanţa 
trebuie specificate în manualul testului. 
Obiectivitatea 

Obiectivitatea înseamnă înregistrarea observaţiilor pentru a elimina erorile de rememorare, notarea 
răspunsurilor după anumite reguli. Cele mai obiective instrumente sunt testele cu răspunsuri corecte 
pentru că se utilizează o grilă de corectare stabilă. Se spune despre un test că este obiectiv dacă el 
permite să se măsoare fără ambiguitate capacităţile unei persoane (Klausnitzer, 1992). În literatura de 
specialitate se menţionează trei condiţii ale obiectivitatii: 

e Rezultatele să nu depindă de nivelul pregătirii subiectului în domeniul testării psihologice 

e Fiecare răspuns la item să fie interpretat la fel de către mai multi experți 

e Scorul să nu fie influenţat de personalitatea examinatorului, adică să aibe cotatie obiectivă 
Ultima dintre condiţii nu este îndeplinită de multe teste, în special cele proiective şi cele de cunoştinţe 
cu răspuns deschis. Cu toate acestea se poate ajunge la un grad de obiectivitate şi în aceste situaţii. 
Deşi testul nu este pe deplin obiectiv, certitudinea interpertărilor reprezintă un aspect al obiectivitatii 
acestuia. 
Tipuri de instrumente psihologice 
Din perspectiva gradului de standardizare se pot regăsi aceleaşi două extreme: probe foarte 
formalizate- denumite în general- obiective, şi probe deschise către problemele specifice individului, 
cu un grad mai mic de formalizare, ca ambiguitate a testului şi variabilitatii răspunsurilor- printre care 
se numără probele proiective. 


Observatia în examenul psihologic 
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În orice examen psihologic este necesară completarea rezultatelor cu alte date. Observatia este utilizată 
pentru completarea cu date obiective a rezultatelor şi desprinderea semnificației lor complete. Şi actul 
observaţiei poate fi făcut în două maniere polare- una strict obiectivă, formală, neutră, după o grilă, şi 
o altă manieră, mai puţin analitică, dar focalizată pe imaginea globală a persoanei examinate. 
Dezavantajul observaţiei sistematice, obiective este dificultatea de a integra datele obţinute într-o 
imagine globală, cu sens, a persoanei. În practică cele două maniere se pot completa. Observarea are 
ca obiecte, de regulă, atitudinea subiectului faţă de examen, faţă de examinator, variațiile în 
comportamentul rezolutiv al subiectului, încrederea în sine, interesul pentru teste. 


Conduita examinatorului 
Atitudinea celui care examinează poate evolua între neutru, obiectiv şi personal, subiectiv. În funcţie 
de caracteristicile examenului şi ale subiectului examinat atitudinea se poate adapta. În ipostaza 
formală, examinatorul are un comportament standard, oferă explicaţii sau instrucțiuni standard, 
neimplicativ, înregistrează răspunsurile sec, evită abordarea personală, în scopul de a nu influenţa în 
nici un fel situaţia, şi de a păstra standard situația de examen pentru toți subiecții. Atitudinea 
personală, subiectivă şi mai puţin formală, deschisă maschează caracterul de examen al situaţiei şi este 
utilă în relaţie cu subiecţii anxioşi. În condiţiile examenului clasic, psihometric subiectul nu trebuie 
ajutat când este în dificultate, în afara situaţiilor când este evidentă suferinţa cauzată de nereuşită. 
Explicatiile sunt scurte şi la obiect. În situaţia evalurii dinamice, formative subiectul este încurajat, 
fără a-i fi oferite informaţii legate de răspunsuri. Supravegherea în timpul examenului nu permite 
perturbarea spontaneitatii comportamentului şi activităţii subiectului, pentru a nu-i creea insecuritate, 
mai puţin în cazurile evidente de fraudă. 
În literatura de specialitate se menţionează unele trăsături de dorit ale examinatorului: 
e Sănătate şi securitate emoțională 
Simţul umorului 
Flexibilitate 
Abilitatea de contact 
Focalizarea pe rezolvarea probleme prin intermediul aplicării psihodiagnozei- nu doar pentru 
constatarea performanţei în termeni cantitativi- clasificare 
e Cu competenţa teoretică compatibilă cu explicarea comportamentului concret şi înţelegerea 
fundamentului teoretic al testului 
e Cu competenţa privind selectarea celei mai adecvate, unitare şi mai integrate baterii de teste 
pentru o situaţie concretă 


1.1.3. PROCESUL DECIZIONAL ÎN EVALUAREA PSIHOLOGICĂ 


Justificarea esenţială pentru testare este de a obţine informaţii care să sprijine rezolvarea unei 
probleme prezente. Datorită faptului că pe baza rezultatelor se poate interveni asupra vieţii unei 
persoane este nevoie să fie controlate cât mai multe variabile posibil iar strategia să fie cea mai 
adecvată. Intervenţia este eficientă în măsura înţelegerii naturii problemei şi astfel prin utilizarea unor 
instrumente adecvate, formale şi informale pentru a obţine o informaţie bogată şi variată, relevantă 
pentru decizie. 

Aceste conditionari impun un prim set de reguli: 

e Testarea psihologică se face doar când există o problemă specifică, suficient de bine definită 
pentru a permite decizia privind adecvarea testării. 

e Testarea impune necesitatea ca examinatorul să dispună de capacitatea de a traduce informaţia 
dată de test în prescriptii cu sens, practice şi adecvate situaţiei şi problemei ce se cere 
rezolvată, inclusiv la nivel de recomandare practică pentru cel examinat. 

e Testarea impune cunoaşterea şi folosirea adecvată a consideratiilor etice şi deontologice 
privind utilizarea testelor psihologice. 
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Modelări ale strategiei de decizie 
Există două niveluri de decizie în sarcina psihodiagnostică 

1. clasic- clasificarea euristică 

2. prin modelare- evaluarea comparativă 
Prima abordare reflectă modul tradiţional de concepere a diagnosticului în medicină, respectiv se 
bazează pe “sisteme nozologice”(o colecţie cunoscută de informaţii cheie ce pot fi identificate prin 
simptome observabile) şi un set informal de principii care ghidează procesul de inferenta, exprimat 
sub forma unor judecăţi de tipul- “dacă.....atunci...” şi raportează rezultatul la un diagnostic. 


A doua abordare se bazează pe un model structural al sistemului şi pe un model formal de 
comportament, definibil ca “normal”, “echilibrat”, “adecvat”, versus “inadecvat”, “deficient”, 
“patologic”. 

Psihodiagnosticianul trebuie să decidă prin identificarea unui set de cauze sau condiţii care indică o 
anumită funcţionare pozitivă sau negativă. Psihodiagnosticul este o formă particulară de explicație a 
funcţionării pozitive sau negative cu sprijinul unei teorii asupra psihicului. În modelele de tip 
constructiv se procedează prin recunoaşterea simptomelor şi raportarea lor la un model de sistem. 
Psihodiagnoza constructivă poate construi astfel toate tipurile de disfuncţii care pot apare în interiorul 
unui sistem, chiar şi pe cele nemanifestate încă. 


Fenomenologia testării psihologice 
Conceptul de fenomenologie a testării a fost formulat de Snygg şi Combs, în 1959, si 
reprezintă abilitatea de a surprinde şi de a înţelege cadrul intern de referinţă al examinatului. Datorită 
multiplelor influenţe ce se manifestă în testare înţelegerea cadrului subiectului, din punctul său de 
vedere este importantă pentru că permite evaluarea cu sens asupra sa(diagnostică şi prognostică) şi cu 
sens pentru acesta, si permite găsirea unei modalităţi de rezolvare a unor probleme. Înțelegerea 
cadrului intern de referință al subiectului implica sensibilitate, intuiţie şi atenție in special privind 
comportamentul non-verbal, nu numai verbal, şi poate fi dificilă pentru examinatorul rigid, defensiv. 
Examinatorii rigizi şi defensivi se simt ameninţaţi şi induc astfel anxietate şi subiectivism în relaţia cu 
cel examinat. 
Decizia poate fi influenţată de trei mari zone informaţionale: mediul exterior- sociocultural şi fizic; 
psihicul subiectului- cu nivele diferite de accesibilitate; şi instrumentele psihologice- cu nivele diferite 
de profunzime. 
Mediul ţine de caracteristicile concrete ale situaţiilor de testare şi de stările mediului fizic. 
Psihicul subiectului prezintă un nivel accesibil observaţiei şi un nivel mediat multiplu- infrastructura 
psihică, substratul neuro-biologic şi substratul genetic. Psihismul subiectului este un tot unitar care 
reprezintă o unitate funcțională a mai multor instanţe: 
e Una vizibila, observabilă, comportamentală 
e Constiinta- structura psihică conştientă- despre care subiectul poate relata 
e  Substratul inconştient al psihismului- infrastructura psihică profundă- pe care subiectul nu o 
cunoaşte şi nu o poate relata 
e Dincolo de instanţele psihice există o infrastructură funcțională, biologică- neuro-biologică şi 
genetică 
Cei mai semnificativi factori ce pot afecta starea subiectului sunt: 
e Anxietatea 
Nevoia de a se prezenta într-o lumină favorabilă 
Nesiguranta în răspunsuri 
Setul de expectatii mentale 
Deprinderile cognitive 
Prejudecatile şi idiosincrasiile 
Abilitatile verbale si de exprimare, fluenta verbală şi de raţionament 
Capacitatea de înţelegere prin lectură 
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Dintre toţi factorii anxietatea se manifestă în toate tipurile de teste, dar mai ales in cele obiective, de 
performanţă şi în interviu, deoarece subiectul se află în situaţia existenţei unui posibil pericol la adresa 
stimei de sine. Anxietatea este acel factor general de tensiune şi instabilitate care face ca persoana să 
nu se simtă în largul ei, neliniştită de teama eşecului, a necunoscutului.Alte surse ale anxietatii sunt 
necunoaşterea modul de reacţie la teste, relaţia cu personalitatea şi conduita examinatorului, seturi de 
expectatie şi reacție neconforme cu ceea ce se aşteaptă de la subiect. Aceasta poate afecta răspunsurile 
subiectului, de aceea este recomandată clarificarea acestuia privind modul de desfăşurare a testării şi 
liniştirea acestuia. Un exercițiu posibil pentru reducerea anxietatii are trei secvenţe: 
jeşirea(imaginativă) din situaţia imediată, imaginarea unei alte situaţii de perfectă securitate şi linişte, 
readucerea în situaţie. 

Din perspectiva instrumentelor utilizate acestea pot viza performanţa, autoevaluarea, evaluarea 
celorlalţi, evaluarea unor dimensiuni ale personalităţii prin metode psihometrice sau prin metode 
proiective. Acestea aduc informaţii din diverse unghiuri asupra subiectului: 

e Din unghiul capacităţilor şi aptitudinilor subiectului, ce tin de comportament şi de constiinta- 
adresându-se nivelului conştient 

e Din unghiul imaginii de sine- adresându-se conştientizării de sine 

e Din unghiul probelor nestructurate, în care subiectul proiectează predominant conţinuturi 
inconştiente- probele proiective (ambiguitatea sarcinii accesează nivelul inconştient; de 
exemplu testul Szondi accesează nivelul biologic şi genetic al unităţii care este omul). 

e Din unghiul auto-evaluării cât şi din unghiul hetero-evaluarii(evaluarea celorlalți, sau a 
examinatorului). Evaluarea celorlalți se produce tot la nivel conştient, vizibil, dar aduce în plus 
propriile elemente inconştiente(idiosincrasii şi prejudecăţi, reperul evaluărilor fiind imaginea 
de sine a evaluatorului). 


1.1.4. PSIHODIAGNOZA FORMATIVA- TENDINŢĂ CONTEMPORANĂ 

Deoarece este o tendinţa tot mai actuală, mai ales în evaluarea aptitudinală, psihodiagnoza 
formativă merită o abordare separată. Diagnosticul, în acest tip de abordare, este formativ(nu 
constatativ) pentru că poate ghida intervenţia, în sensul evidentierii funcţiilor psihice şi operaţiilor 
gândirii, deficitare şi care necesită dezvoltare, pentru creşterea performanţelor. Diagnosticul pune 
accentul, nu atât pe constatarea performanţei şi pe această baza a clasificării şi a predictiei 
performanţei viitoare, cât pe capacitatea persoanei de a se schimba, în urma unei etape de învăţare. 
Astfel ceea ce se măsoară este un potenţial de învăţare, nu un coeficient intelectual. În evaluarea 
tradițională psihometrică indivizii sunt comparati raportându-se la normele specifice vârstei, spre 
exemplu în ceea ce priveşte inteligenţa academică. Aceasta se bazează pe presupozitia că că ei au avut 
oportunităţi egale de a învăţa anterior testării. Principala inovaţie pe care evaluarea formativă o aduce 
în câmpul psihometriei este legată de semnificaţia acordată coeficientului de inteligenţă. Deşi acesta 
reprezintă o măsură a performanţei într-un anumit moment, într-un anumit context, privind capacitatea 
de a profita şi învăţa din experienţele trecute la care a fost expus un subiect, există puţine motive să 
asumăm sau să acceptăm că performanţa la un test de inteligenţă furnizează o măsură stabilă şi de 
încredere a performanţei viitoare. Valorile mici ale coeficienţilor de validitate de criteriu(predictivă) 
demonstrează acest lucru. Evaluarea formativă pune accentul pe capacitatea de schimbare a fiinţei 
umane şi influenţa factorilor de mediu, chiar şi în cazurile când există afecţiuni organice, limitând 
astfel influenţa factorilor genetici, generatori de discriminare socială, din perspectiva autorilor acestei 
abordari(Feuerstein, R., 1979). 
Sursa dificultatilor cognitive ale subiectului poate fi localizata intr-una din cele trei faze ale actului 
mental: inputul, elaborarea, outputul. Majoritatea pot fi determinate de ceea ce se cheamă deficit al 
medierii în învăţare, în experiența de viata a subiectului. Ca atare intervenţia de îmbogăţire 
instrumentală a subiectului trebuie să se bazeze pe medierea învăţării. 
În timpul evaluării examinatorul poate susține procesul de rezolvare a problemelor prin trei tipuri de 
intervenţii de ajutor: 
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e Sunt utilizate sarcini a căror rezolvare nu depinde în mod necesar de achiziţiile cognitive 
anterioare; 

e Sunt anihilate acele obstacole actuale, prezente, care duc la ineficienta funcţionării cognitive; 

e Este indus un nivel optim de funcționare mentală, în funcție de natura sarcinii şi de capacitatea 
subiectului. 


Interacțiunea examinator- subiect nu este o simplă repetare, amplificare de informaţii sau reluare a 
unor modele habituale ale subiectului, ci vizează îmbogățirea repertoriului de interacțiuni. Conceptul 
teoretic de la care s-a pornit este acela de “zonă proximă a dezvoltării”, concept introdus de doi 
psihologi ruşi Luria şi Vigotski. Zona proximă a dezvoltării reprezintă o acea zonă virtuală în care o 
capacitate actuală poate evolua. Principiul fundamental este reducerea distanţei dintre performanţă şi 
competenţă, şi crearea unor condiţii şi contexte ale situaţiei problematice care pot facilita şi valorifica 
potentialele latente. În cadrul examenului au loc mai multe secvențe: 

e Faza de aplicare iniţială, în care se măsoară capacitptile rezolutive ale subiectului, fără a se 
acorda ajutorul examinatorului, prin itemi din teste psihometrice traditionale(ex. Raven) 

e Faza de învăţare în care dacă subiectul a greşit rezolvarea la anumiţi itemi i se oferă ajutorul 
pentru rezolvarea corectă sau pentru rezolvarea celor nerezolvati, fiind orientat în aşa fel încât 
să descopere singur- învăţare mediată 

e Faza de evaluare a gradului de transferabilitate şi de integrare în structurile cognitive, 
operatorii ale subiectului, a cunostiintelor introduse în faza a doua. Sunt utilizaţi itemi ai unor 
teste paralele. 

e Se utilizează tipuri de probleme adaptate nivelului optim al eficienţei funcţiilor mentale, în 
funcție de vârstă sau de tipul de deficiență mentală 

e Se ameliorează componentele metacognitive- cele care ţin de motivaţie atenţie, ce intervin în 
funcţionarea cognitivă. 

Scorurile obţinute în faza 1 şi în faza 3 sunt utilizate la determinarea profitului cognitiv, acesta fiind o 
masura mai valida a potenţialului de învăţare, şi un predictor mai bun al performanţei viitoare. 
Rezultatele se referă la patru aspecte: 

1. Măsurarea validă a competenţelor cognitive ale subiectului 

2. Determinarea dificultatiilor funcționale majore care apar în timpul rezolvării sarcinii 

3. Compararea nivelului de dezvoltare cognitivă cu potenţialul de învăţare 

4. Delimitarea condiţiilor psiho-pedagogice susceptibile pentru activarea potentialelor cognitive 


Evaluarea dinamică, formativă presupune schimbări metodologice în următoarele patru domenii: 

1. În structura testelor- Instrumentele de testare trebuie să fie construite într-un mod care să 
ofere examinatorului şi examinatului sarcini ce pot fi utilizate într-un proces de învăţare şi 
care pot permite examinatorului să evalueze efectul procesului de învăţare asupra 
capacităţii individului de a face fata unor situaţii noi. 

2. În situaţia de examinare- Trecerea de la un scop static la unul dinamic, implică o 
schimbare în situaţia de testare care va transforma examinatorul într-un profesor-observator 
şi examinatul într-un student-executant. Această transformare atrage după sine o varietate 
de schimbări în interacţiunea obişnuită şi stabilirea unui proces de comunicare în dublu 
sens. 

3. În orientarea testelor- schimbarea de accent de la rezultate la procesul de obţinere a 
rezultatelor este o altă schimbare necesară pentru a trece de la o abordare statică la una 
dinamică. 

4. Interpretarea rezultatelor- Vârfurile de performanţă între rezultatele obţinute trebuie 
utilizate ca o indicație a potenţialului examinatului. 


Unul dintre cei mai importanţi reprezentanţi ai acestei orientări este Reuven Feuerstein. 
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Principala contribuţie a noii direcţii de dezvoltare poate fi rezumată prin accentul pus pe evaluarea 
intelectului prin sarcini de învăţare. In cele ce urmează pe parcursul întregului manual ne vom situa în 
cadrul psihometric, al psihometriei clasice în cea mai mare parte. 


1.2. FUNCŢIILE PSIHODIAGNOZEI 


Psihodiagnoza ca activitate sistematică de evaluare psihologică are următoarele funcții: 

1) Surprinderea corectă a trăsăturilor şi capacităților psihice individuale şi evidenţierea variabilitatii 
psiho-comportamentale intra-grupală versus grup de referinţă 

2) Evidenţierea cauzelor care au condus spre o anume realitate prezentă, în special în cazul 
disfunctiilor sau tulburărilor psihice 

3) Prognoza evoluţiei probabile a comportamentului persoanei în anumite condiţii şi situaţii 
contextuale, în funcţie de repere 

4) Evidenţierea cazurilor de abatere în sens pozitiv sau negativ de la o norma(etalon) de dezvoltare 
psiho-comportamentală; se pune problema distinctiei între normalitate şi anormalitate 

5) Evidenţierea sau validarea(demonstrarea funcţionalităţi) programelor de învăţare şi formare 

6) Formarea unor capacităţi de cunoaştere şi autocunoaştere 

7) Sprijinirea unor decizii în consiliere şi orientare vocationala (evidenţierea de capacităţi şi 
motivaţie) 

8) Sprijinul deciziilor de conduită în demersul din psihoterapie, asistenţă, consultanţă psihologică 

9) Verificarea unor ipoteze ştiinţifice, prin utilizarea testelor în cadrul experimentelor ştiinţifice 


1.3. PRUDENȚĂ ŞI ABUZ ÎN UTILIZAREA TESTELOR PSIHOLOGICE 


1.3.1. CONSECINȚE NEGATIVE ALE TESTĂRII PSIHOLOGICE 


Pe măsură ce testarea psihologică s-a afirmat ca un curent principal în evaluarea psihologică, în toate 
domeniile aplicative au apărut tot mai evidente unele pericole implicate. Cele mai semnificative se 
referă la condiţia persoanei examinate. Astfel este importantă conştientizarea următoarelor aspecte: 

e Testarea psihologică reprezintă o invadare a vieţii private, a intimităţii unei persoane. De aceea 
testarea psihologică se face numai cu consimţământul informat al persoanei examinate. Atunci 
când este vorba de un minor, dreptul la intimitate trebuie exercitat de părinţii acestuia. 

e Evaluarea poate duce la creşterea anxietăţii persoanei, ceea ce poate conduce la efecte adverse. 
Printre acestea enumerăm influenţa asupra comportamentului şi a performanţei la test, tulburări 
nedorite în viaţa de familie, consecinţe incorecte sau invalidante în plan social ale 
interpretărilor rezultatelor. Evaluarea trebuie, deci, să ţină cont de efectele anxietăţii. 

e Tendința spre autoîmplinire a celui care examinează sau care interpretează, dacă nu este 
suficient conştientizată, poate constitui o sursă de interpretare şi diagnoză greşită a rezultatelor 
testului. 

e Interpretarea greşită la o etichetare incorectă. Etichetarea incorectă a unei persoane va conduce 
spre perceperea socială predominant din perspectiva etichetei. Consecințele pot fi anxietatea şi 
jena în familie, şi, mai grav, limitarea oportunităţilor celui etichetat de a-şi dezvolta adecvat 
potenţialul său general. 

e Oricât de complexă ar fi, o singură probă nu este suficientă pentru o decizie, de aceea este 
necesară o baterie de teste, sau un set de probe, adecvate scopului urmărit. 
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e Utilizarea neprofesionistă a informaţiilor confidentiale rezultate la un test sau interviu poate 
duce la consecinţe grave pentru persoana testată. 

e Este necesar ca persoana care examinează să fie matură şi securizată emotional, deoarece poate 
influenţa reacţia subiectului la test şi rezultatele acestuia. 


Problemele care se au în vedere în comunitatea ştiinţifică, referitor la reducerea consecinţelor negative 
ale testării sunt legate de : 

e Impactul negativ asupra minorităților şi femeilor 

e Descurajarea persoanelor testate şi “institutionalizarea” eşecului pentru indivizi 

e Predarea pentru testare şi limitarea curriculum-ului şi învăţării 

e Accentul pus pe sarcinile de memorare în detrimentul celor care implică procese cognitive mai 

complexe, necesare pentru succesul în lumea reală 
e Crearea de bariere sociale şi organizaționale 


deo. 


1.3.2. NEVOIA DE PSIHODIAGNOZĂ 
Consecințele pozitive ale utilizării adecvate a evaluărilor validate sunt legate chiar de scopurile 
măsurării psihologice: 
e Sunt un ghid pentru luarea deciziilor- selecția celor mai potriviti candidaţi, promovarea bazată 
pe performanţă, premierea bazată pe performanţă 
e Permit o eficienţă şi o eficacitate mare- decizii bazate pe volum mare de informaţii relevante, 
în timp scurt 
e Permit controlul calității 
e Au efect în protejarea publicului care beneficiază de serviciile companiilor- prin reducerea 
angajărilor neglijente în ocupaţii critice 
e Permit obiectivitatea pentru a realiza comparații şi decizii ce privesc indivizii, sau fata de 
criterii obiective prestabilite 
e Implica eficienţă în privinţa costurilor şi utilizării 


Concluzie 
O trăsătură comună a tuturor testelor este precizia lor limitată. Toate îmbunătățirile în tehnologia 
testelor(evaluarea formativă, evaluarea comportamentală, creşterea fidelității şi validității, modele 
teoretice noi) urmăresc gestionarea şi reducerea acestei imprecizii. Sunt extrem de rare cazurile când 
un test furnizează o măsură exactă a unei variabile(reale) care are efecte importante asupra 
comportamentului uman. Din acest motiv, nici deciziile care se iau pe baza lor nu sunt întotdeauna 
corecte (falşii pozitivi- eroare de tip alfa, falşii negativi- eroare de tip beta). De exemplu, unii 
psihologi susțin că, din cauza lipsei de consistență a comportamentului de la o situaţie la alta, 
coeficienţii de corelaţie liniară dintre scorurile unui test de personalitate şi un comportament pe care 
acesta îl prezice nu depaşesc valoarea de 0,3 sau 0,4 (W. Mischel şi R.E. Nisbett, după Funder, 1983, 
apud. Albu M., 1998). Ca lucrurile să fie şi mai complicate apar şi consecinţe negative în urma 
abuzului, utilizării neetice a testelor, sau de către neprofesionişti. 

Dar, nu există alte metode de măsurare, ştiinţifice, mai precise. Prin urmare, testele 
psihologice reprezintă cea mai bună, cea mai corectă şi mai precisă tehnologie ştiinţifică disponibilă 
pentru a lua decizii importante asupra indivizilor (Murphy, Davidshofer, 1991, apud Albu, 1998). 
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1.7. CONCEPTUL DE NORMALITATE PSIHICĂ 


Conceptul de normalitate psihică este folosit deseori în contextul psihologiei. De aceea este util să fie 
cunoscute cât mai corect acceptiunile sale. In mod curent funcţionează trei perspective asupra 
termenului de normalitate: perspectiva statistică, perspectiva social-culturala, perspectiva 
psihomedicală. 


Perspectiva statistică 

Se referă la normalitate ca regularitate caracteristică sau acceptată de un număr semnificativ de 
persoane. Are deci un suport cantitativ- norma- foarte pe larg spus: ceea ce este mai prezent într-o 
populaţie de referinţă este normal, ceea ce nu este prezent nu este normal, este în afara normalitatii. În 
psihologie acceptiunile cele mai utilizate sunt nivelul de excelenţă şi un model sau un etalon în raport 
cu care s-ar putea stabili o măsură sau formula o judecata(Lisievici P., 1997, apud Minulescu, 2003). 
În psihodiagnoză, delimitările dintre normalitatea psihică şi ceea ce iese în afara normalitatii se 
bazează pe masurători cantitative, dar şi calitative, cel mai adesea îmbinate. Variabilele la care se 
referă masurătorile sunt: comportamentul persoanei, cognitiile, sentimentele sau situaţiile, nivelul de 
funcționare sau destructurare al unor mecanisme şi abilități psihice, scopurile tratamentului, dar şi 
concepte teoretice precum eul, stima de sine, starea de bine, calitatea vieţii etc. Procesul de măsurare 
tebuie să fie precis, adică să aibă fidelitate şi validitate. Pentru ca scorurile să poată fi interpretate, să 
aibă sens în raport cu comportamentul uman în genere, se normează gama de rezultate posibile prin 
procedee statistice, adică se urmăreşte modul de distribuţie al rezultatelor de-a lungul unui continuum, 
şi modul in care se comportă populaţia de referinţă, respectiv aflarea tendinței centrale- media, spre 
exemplu şi abaterea de la medie- abaterea standard a mediei, adică variabilitatea comportamentelor în 
populaţia respectivă. 

Multe dintre variabilele psihologice se supun distribuţiei normale, descrisă matematic prin “curba lui 
Gauss”. Pe această curbă valorile medii ale variabilei reprezintă comportamentul majorităţii 
populatiei(68,28%). Abaterile de la zona medie sunt egal distribuite. Abaterile moderate de la medie- 
cu valori cuprinse între o abatere standard de la medie şi două abateri standard- cuprind cate 13,59 % 
din populatie(27,18%). 

Abaterile extreme,cu valori cuprinse între două abateri standard şi trei abateri standard, reprezintă câte 
2,14% din populatie(4,28%). Abaterile reziduale reprezintă 0,13%(in total 0,26%). 

Atunci când măsurăm cantitativ comportamentul unei persoane îl putem încadra în: 

e Comportamentul majoritatii- cei 68,28% din zona medie- şi atunci are un comportament 
normal (la fel ca majoritatea) pentru populaţia respectivă, cum se poate observa în figura de 
mai jos. 

e Comportamentul unei minorități- cei 27, 18 %, din zonele imediat următoare 

e Comportamentul unei excepţii semnificative de la medie, în plus sau minus- cei 4,53% din 
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Pentru fiecare instrument şi fiecare condiţie de folosire a instrumentului se construiesc astfel de 
etaloane după criterii bine definite privind reprezentativitatea populaţiei. 

În această acceptiune normalitate înseamnă determinarea nivelului de eficienţă al unei abilităţi psihice 
sau a unei dimensiuni de personalitate în raport cu modul în care se comportă acestea în populaţia de 
referinţă. În cele două situaţii semnificaţiile unui scor se interpretează diferit. 

Când este vorba despre abilități sau capacități psihice, spre exemplu nivelul inteligenţei, dacă scorul 
subiectului(care reprezintă performanţa sa), se află în zona corespunzătoare mediei, atunci îl 
considerăm în normalitate. Dacă abaterea este în plus, peste medie rezultatul este calificat drept “bun”, 
daca de află între +lo şi +2 o (litera grecească sigma reprezintă notația pentru abaterea standard a 
scorurilor de la medie), şi “foarte bun“ dacă se află între+2 o şi +36. Invers, rezultatul este calificat 
drept “slab” dacă se află între -l1o şi -2 o, şi “foarte slab”, dacă se află între -2 o şi -36. Pentru 
extreme(+3 6 „+4 o; -3 6,-46) vorbim de excepţii pozitive şi excepţii negative. În termeni statistici 
ieşirea în afara normalitatii poate însemna o performanţă de excepţie, dar şi un nivel de retard mental. 
Când este vorba de dimensiuni, caracteristici sau factori de personalitate, în măsura în care aceştia se 
comportă parametric, gradienţii de comportament se raportează tot la curba lui Gauss. Astfel o 
dimensiune precum extraversie-introversie poate prezenta, în urma răspunsului subiectului, un scor la 
medie, în zona normalității(m _+ 1 o). Din punct de vedere psihologic este calificat drept 
“ambiversie”, ceea ce nu are sens pentru că nu indică o entitate de sine stătătoare, ci o nedefinire. Dacă 
subiectul are scoruri, peste medie cu mai mult de 1 o, atunci putem vorbi de un comportament 
extravert normal, iar peste 36, de un comportament extravert extrem. Un comportament extrem poate 
aduce inconveniente pentru că indică, în acest caz, dependenţa de mediu şi evenimente, un grad de 
instabilitate ridicat şi inconstanta afectivă în legăturile cu ceilalți. La fel se interpretează şi scorurile 
care cad sub medie, dar în sensul introversiei, nu al anormalitatii. Deci nu întotdeauna extremele pot fi 
considerate ca ieşiri în afara normalitatii. 


Perspectiva social-culturală 

În acest context vorbim de norme sociale şi culturale, respectiv de reguli sociale sau juridice instaurate 
de societate pentru a favoriza relationarea nondistructivă între membrii societății, şi de modele de 
comportament, obiceiuri, cutume, prejudecăţi ca standarde scrise sau nescrise. Evaluarea curentă 
implică astfel de norme în construirea instrumentelor şi în modul cum subiecţii răspund la chestionare. 
Un comportament “normal” într-o anumită zonă geografică sau comunitate, poate fi socotit “anormal”, 
deviant în spaţiul unei alte culturi sau subculturi din aceeaşi cultură. 

Normele sociale şi juridice impun limite. Încălcarea acestora este sanctionata, până la măsura izolării 
sociale. În acest cadru discutăm de concepte precum adaptare, comportament adaptativ, 
comportament de risc, comportament dezadaptativ sau antisocial, comportament prosocial. 
Individul care ajunge în mod constant să sfideze legea sau norma socială, care nu se poate adapta, şi 
care poate comite infracţiuni repetitive sau bizare, are structurări de personalitate particulare, grupate 
sub denumirea de “tulburări de personalitate sociopate”. 


Perspectiva psihomedicală 

În această perspectivă discutăm despre criteriul comportamentului auto sau heterodistructiv, şi despre 
condiţia de boală psihică, şi implicit despre conceptul de sănătate mintală. Există diferite grade de 
anormalitate psihică. O condiţie de anormalitate relativă poate fi considerată spre exemplu depresia, 
când persoana are tendinţa de izolare, cu pericolul latent de ideatie distructivă sau suicidară, sau 
suspiciozitatea şi interpretativitatea, specifice structurilor paranoide, care afectează şi viaţa celor din 
jurul persoanei. Vorbim astfel de personalităţi accentuate, de comportamente reactive la stres sau 
la condiţii existențiale extreme. Pentru astfel de situaţii există consilierea psihologică şi psihoterapiile 
de diferite orientări. 

Pentru marea patologie psihică, în care boala domină viaţa persoanei, există psihiatria şi psihoterapia 
intra muros. 
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Alte concepte care intervin în problematica normalitatii în psihologie 
Tot în contextul psihopatologiei discutăm de conceptul de anormalitate. Anormalitatea vizează mai 
ales comportamentul şi conduita. Anormalitatea apare ca o perturbare de fundal iar boala psihică 
implică un aspect procesual; anormalitatea se referă mai ales la structura şi organizarea psihică, iar 
boala implică un proces morbid. Anormalitatea se relevă mai ales în tulburările de comportament, iar 
boala ca proces morbid interesează patologia clinică. 
Tulburarea psihocomportamentala, anormalitatea se manifestă ca discordanta între dorința persoanei, 
acţiunea sa şi ceea ce se aşteaptă şi se cere de la aceasta în contextul social. 
Criterii uzuale ale deviantei psihopatologice: 

e Disconfort psihic foarte intens şi de durată mare(stare cronică de anxietate sau depresie) 

e Ineficienta cognitivă- incapacitatea de a gândi clar realitatea sau de îndeplinire a obligaţiilor 

sociale, profesionale, de familie- eşecul 
e Tulburări în funcționarea organismului 
e  Devianţa comportamentală de la normele sociale 


Sănătatea mentală 
Intervine în delimitarea conceptului de normalitate şi este definită, de obicei, prin următoarele 
caracteristici: 
e Capacitatea de conştientizare, acceptare şi corectitudine în modul cum se concepe pe sine 
Stăpânirea mediului şi adecvarea în modul de a face faţă cerinţelor vieţii 
Integrarea şi unitatea personalității 
Autonomia si încrederea în sine 
Percepere realistă şi încredere în sine 
Continuitatea dezvoltării personale spre auto-actualizare 


Alte criterii ale normalitatii(dupa Diamond şi Ellis, apud Dobranici, L. 2007) 
e constiinta clară a eului personal 
e capacitate de orientare în viata 
e nivel înalt de toleranţă la frustrare 
e  autoacceptare 
e flexibilitate în gândire şi acţiunea 
e realism şi gândire antiutopică 
e asumarea responsabilitatii pentru tulburările sale emoţionale 
e angajarea în activităţi creatoare 
e angajarea moderată şi prudentă în activităţi riscante 
e conştiinţă clara a interesului social 
e gândire realistă 
e acceptarea incertitudinii şi capacitatea de ajustare a acesteia 
e îmbinarea plăcerilor imediate cu cele de perspectivă 


Maturitate psihică 
Conceptul de maturitate psihică nu are o relevanţă directă pentru psihometrie dar prilejuieşte cele mai 
interesante şi fructuoase dezbateri, cu reverberatii mai largi decât cadrul psihometriei, până la 
magnitudinea celor despre condiţia umană. 

Prezentăm spre exemplificare câteva concepţii psihanalitice despre normalitate (L. Dobranici, 
2008): 
S.Freud: ,,Normalitatea este o ficţiune ideală; fiecare ego este psihotic într-un anumit moment într-o 
măsură mai mare sau mai mică”; 
K.Eissler: ,,Normalitatea absolută nu poate fi obţinută, deoarece persoana normală trebuie să fie pe 
deplin conştientă de gândurile şi sentimentele sale”; 
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M.Klein : „Normalitatea este caracterizată prin tărie de caracter, capacitatea de a face fata emoţiilor 
conflictuale, capacitatea de a trăi plăcerea fără a provoca conflicte şi capacitatea de a iubi”; 

E.Erikson: „Normalitatea este capacitatea de a fi stapân pe perioadele vieţii: încredere/neîncredere; 
autonomie/îndoială; initiativa/vinovatie; activitate, productie/inferioritate; identitate/confuzie de rol; 
creatie/stagnare; integritatea ego-ului/disperare”. 

H.Hartmann: „Funcţiile libere de conflicte ale ego-ului reprezintă potenţialul persoanei pentru 
normalitate; măsura în care ego-ul se poate adapta la realitate şi poate să fie autonom sunt asociate 
sănătății mintale”; 

K.Menninger : «Normalitatea este capacitatea de a se adapta lumii exterioare cu mulţumire şi cu 
capacitatea de a stăpâni fenomenul de aculturatie”’; 

A.Adler: „Capacitatea persoanei de a dezvolta sentimente sociale şi de a fi productiv/creativ sunt 
legate de sănătatea mintală; capacitatea de a munci creşte stima de sine şi face persoana capabilă de a 
se adapta”. 

R.E.Money-Kryle: “Normalitatea este capacitatea de a atinge deplina conştiinţă de sine care de fapt nu 
este niciodată pe deplin obţinută”. 

O.Rank : « Normalitatea este capacitatea de a trăi fără teamă, vinovăţie sau anxietate şi aceea de a 
avea responsabilitatea propriilor acţiuni”. 


După cum se observă abordările par destul de diferite, deşi sunt toate în acelaşi cadru teoretic, al 
psihanalizei. Prima constatare ar fi că nu există o coerenţă printre autori care fac parte chiar din 
aceeaşi orientare teoretică. Acelaşi lucru îl putem spune şi despre conceptul de maturitate. Nu există 
un model coerent unic în psihologie, aplicabil la orice condiţii, prin care să delimităm maturizarea. 

În psihologie, utilizarea termenului de maturitate psihică impune criterii de judecată care se referă 
la structura, funcţionarea şi echilibrul psihic al persoanei. Cadrul cel mai general prin care putem 
defini normalitatea psihică, din perspectiva psihologiei umaniste, implică trei aspecte simultan: 

e Capacitatea dea stăpâni activ mediul 

e Manifestarea unei unităţi a personalității 

e Capacitatea de a percepe corect lumea şi propria persoană 


Aceste aspecte sunt câştiguri ale persoanei de-a lungul dezvoltării sale ontogenetice. O să infatisam pe 
scurt una dintre viziuni, cea a personologului (de orientare psihanalitică) Erik Erickson despre 
competențele care se câştigă la diferite vârste. 


Încă din primele stadii copilul depinde foarte mult de oportunităţile care i se oferă. De la naştere până 
la 18 luni copilul rezolvă problema încrederii fundamentale (conflictul incredere-neincredere) în urma 
căruia capătă speranță. În copilăria timpurie, între 18 luni şi trei ani copilul rezolvă problema 
autonomiei(conflictul autonomie- ruşine), în urma căreia capătă auto-control, curaj şi voinţă. Între trei 
şi cinci ani copilul rezolvă conflictul initiativa- vină, în urma căuia începe să-şi propună şi să atingă 
propriile sale scopuri 


Astfel vârsta şcolară presupune formarea unui sentiment de competenţă personală, dobândirea unui 
statut şi a unor deprinderi adecvate, acestea fiind criterii de evaluare ale etapei de vârstă. Perioada 
adolescenţei are de rezolvat problema identităţii, ceea ce duce la constituirea autonomiei şi a increderii 
în sine. 

Perioada adultului tânăr ar trebui să conducă la rezolvarea crizei identităţii, în sensul capacităţii de a 
empatiza, a stabili relaţii apropiate cu semenii, a iubi. În perioada adultă maturitate înseamnă 
rezolvarea crizei caracteristice stagnării, în sensul întăririi capacităţii generative a persoanei, a formării 
structurilor atitudinal-afective care permit comportamentele de asumare a responsabilitatii, a deciziei 
Şi independenţa în evaluare. 

Perioada senectutii înseamnă dobândirea înţelepciunii prin depăşirea crizei disperării şi conservarea 
integrării emoţionale. Putem utiliza aceste criterii pentru a stabili în ce măsură o persoană este 
adecvată vârstei sale, şi astfel matură, sau normală. 
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Individuare si autoactualizare 
Conceptul privind sensul personal al vieţii, care, fata de psihanaliza freudiană, dă consistenţă şi 
înţeles dezvoltării individuale spre autonomie şi împlinire, a fost dezvoltat de Carl Gustav Jung, încă 
de la începutul secolului trecut. Pentru Jung, individuarea are sensul unei diferențieri a tuturor 
structurilor psihicului printr-o continuă şi concomitentă integrare în sfera vieţii conştiente, tendință 
pusă în joc de funcţia transcendentă, de individuare, înscrisă în fiinţa umană. La Jung individuarea 
implică descoperirea conştientă şi intrarea în relaţie cu un conţinut obiectiv al psihicului, pe care, 
pornind de la filosofia indiană(Upanişade) şi bazându-se în cele din urmă pe spiritualitatea 
occidentală, îl denumeşte Sine. Astfel, în procesul de auto-actualizare a acestor conţinuturi obiective 
se dezvoltă o identitate a eului mai stabilă şi continuă, transformarea eului obişnuit în eul înţelept. În 
context, boala psihică reprezintă o gamă de simptome care semnalează ieşirea din această direcţie de 
creştere, ceea ce conduce la regresii şi stagnări nevrotice. 
Ulterior, şcoala umanistă din psihologia americană(Abraham Maslow, Carl Rogers, Erich 
Fromm etc.) a lansat conceptul de auto-actualizare sau auto-realizare, ca un prag în care motivaţia 
firească de creştere, este depaşită la nivel uman printr-o meta-motivatie care dă naştere acţiunii meta- 
trebuintelor. Aceasta reflectă integrarea în sensul existential personal a unor valori ideale precum 
frumuseţea, unicitatea, ordinea, perfecțiunea, participarea. Abraham Maslow propune un set de 
indicatori care caracterizează o persoană ce a atins acest prag al dezvoltării umane. Aceste persoane 
constituie mai degrabă o excepţie fericită de la normă şi pot fi caracterizate prin: 
e Limpezime în modul de percepere a realităţii şi capacitate de a accepta ambiguitatile existenţei 
e Acceptare de sine şi a celorlalți, fără judecată, şi un grad minim de anxietate su vinovăţie 

legată de sine 

Comportament spontan şi fantezie în gândire, dar nu sunt total neconventionali 

Centrarea pe o problematică, mai degrabă decât centrare pe sine 

Capacitate de a privi viaţa cu obiectivitate şi căutarea solitudinii 

Comportament independent, autonom, dar nu rebel 

Iubire a vieţii 

Trăiri de extaz, chiar legate de sentimentul de putere, cu momente de mare creativitate, de 

stăpânire a necunoscutului 

Implicare socială şi identificare simpatetică cu orice om 

Experiente interpersonale profunde, dar, de regulă, cu puţini oameni 

Respect pentru ființă 

Cunoaşterea diferenţei dintre mijloc şi scop şi lipsa neliniştii că trebuie să suporte un anumit 

mijloc pentru a atinge un scop 

e Un sens filosofic al umorului, spontaneităţii, jocului şi lipsa de agresivitate fata de ceilalți 

e Capacitatea de a descoperi probleme şi sensuri, mai ales în domeniul pe care sunt centrate 

e Faptul ca nu permit “culturii” să le controleze. 


Toate aceste discuţii despre normalitate permit psihologului să identifice mai clar în ce cadru trebuie 
să se plaseze atunci când utilizează rezultatele pe care o persoană le-a obţinut la un test psihologic. 
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2. PERSPECTIVĂ ISTORICĂ ASUPRA PSIHODIAGNOZEI 
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2.1.Repere privind preocupările dinaintea construirii testelor 

2.2.Evolutia psihodiagnozei în secolul XX 

2.3.Continuitate şi discontinuitate în evoluţia psihodiagnosticului in 
România 


2.1. REPERE PRIVIND PREOCUPĂRILE DINAINTEA CONSTRUIRII TESTELOR 
350 î.e.n. Aristotel afirmă importanţa observării obiective în cunoaşterea comportamentului uman şi 
formulează primele trei principii care pot să explice asociaţia de idei. 
1650 Rene Descartes consideră relaţia corp - minte ca interacţiune. 
1822. F. Bessel realizează primele experimente semnificative în măsurarea diferenţelor individuale în 
ce priveşte timpul de reacţie, cu aplicaţie la observaţiile astronomice. 
1869. Studiul ştiinţific al diferenţelor individuale începe cu cercetările lui Sir F. Galton, văr cu Ch. 
Darwin, care studiază diferenţele individuale şi aplică ideea lui Darwin privind adaptarea selectivă la 
cerinţele mediului. începe măsurarea sistematică a diferenţelor umane privind înălțimea, mărimea 
capului şi viteza de calcul. în mare măsură, munca sa a fost orientată spre investigarea inteligenţei 
superioare şi abilităţilor, pe care le considera în mare măsură înnăscute. Contribuţia sa cuprinde atât 
măsurători fizice şi psihice, cât şi dezvoltarea unor tehnici de statistică prin care urmărea determinarea 
relaţiei dintre aceste măsurători. 
In 1960 publică Clasificarea oamenilor în funcţie de darurile lor naturale, inițiind astfel studiul 
ştiinţific al diferenţelor individuale. In 1884 prezintă la Londra un laborator antropometric, comparabil 
cu laboratorul german de psihologie experimentală al lui Wundt. 
1879. Galton dă prima descriere sistematică a unui test de asociaţie liberă, iar în 1983 publică 
Inquiries into human faculty and its developments, care, după unii autori (M. Reuchlin), marchează 
trecerea de la metodele de laborator de psihologie experimentală la metode simple şi aplicabile pe 
eşantioane largi de subiecți. 
1884. S. Hull fondează primul laborator american, Universitatea J.Hopkins. 
1888. J. Mckeen Cattell inaugurează un laborator de testare la Universitatea Pennsylvania. in 1890 
introduce termenul de „teste mentale". Inventează „deviația standard" ea măsură statistică a 
variabilitatii rezultatelor în raport de medie. 
1891. Munsterberg propune în Germania o serie de probe pentru Studierea diferitelor profesiuni. 
1896. Kraepelin raportează testarea comparativă a celor bolnavi mental cu oamenii normali. Studii 
experimentale privind memoria. 
1898. Expediția Torres Straits introduce pentru prima oară studiul Indivizilor analfabeți cu ajutorul 
unor instrumente psihologice ( McDougall, Myers). 


Un număr de psihologi urmează direcția deschisă de Galton în studiul diferenţelor intelectuale. 
Cel mai semnificativ este psihologul Alfred Binet, care inventează, cu Simon, o scală practică pentru 
identificarea copiilor care pot beneficia de şcolarizare, inițiind astfel testarea inteligenţei. Binet 
introduce în plus față de demersul lui Galton ideea de a cere subiecţilor să răspundă unor sarcini 
complexe precum definirea cuvintelor sau punerea în aplicare a unor instrucţiuni. Psihologii de până 
atunci măsurau performanţe psihofizice şi senzoriale simple (Weber, Fechner), precum 
timpul de reacţie, considerate a fi ,,caramizile"inteligentei. 
Apariţia şi dezvoltarea unor instrumente psihologice sunt legate de psihologia experimentală 
(măsurarea diferitelor procese psihice sau psihofizice simple), de dezvoltarea treptată a şcolii de 
psihologie clinică de la Paris, precum şi de începutul cercetărilor de psihologie diferenţială. 


2.2. EVOLUŢIA PSIHODIAGNOZEI ÎN SECOLUL XX 


Binet şi Simon încep încă din 1900 primele interviuri sistematice pentru măsurarea inteligenţei. 
încă dinainte de începutul secolului XX, ei scriu despre scopul psihologiei individuale ca studiu al 
omului, evidențiind trei probleme importante ale acesteia: 


e studiul diferenţelor individuale ale proceselor psihice fără să se studieze special relaţia cu 
indivizii care prezintă aceste procese; 


e studiul diferenţelor individuale ale indivizilor izolați sau grupelor de indivizi; 
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e studiul raportului diferitelor procese psihice între ele în cadrul aceluiaşi individ. 


Ei evocă două metode de studiu a raporturilor diferitelor procese psihice la un acelaşi individ 
normal: 

1. să faci procesul să varieze şi să examinezi dacă această variaţie antrenează schimbări în 
alte procese la aceeaşi persoană; 

2. să studiezi un anumit număr de procese psihice, alese în prealabil, la mai multi indivizi 
şi să examinezi dacă diferenţele individuale între procese sunt paralele şi corespund de 
la un individ la altul (relaţia între aceste procese fiind dedusă din această 
corespondenţă). 

A doua metodă se va constitui ca una dintre primele finalitati ale metodei testelor. 


1904 Spearman introduce teoria bi-factorială a inteligenţei (factor general şi factori specifici) şi 
propune proceduri statistice. 

1905 Jung prezintă Experimentul asociativ-verbal pentru a descoperi şi diagnostica complexele 
inconştiente. 

1905 Nicolae Vaschide şi Henry Pieron, în Franţa, pun la punct tehnicile psihometrice ca metode ale 
psihologiei experimentale. 

1905 Alfred Binet deschide un laborator într-o şcoală primară din Paris şi. împreună cu Simon, 
dezvoltă şi prezintă o scală de diagnostic a nivelului intelectual pentru copii normali şi anormali tip 
screening. 

1908 Binet şi Simon prezintă a doua scală de inteligenţă. Inventează ideea de vârstă mentală. Are loc 
introducerea, in S.U.A., a scalei lui Binet. Pieron introduce termenul de comportament în Franţa. Lahy 
studiază selecția conducătorilor de tramvai. în Belgia apare primul cabinet european de orientare 
profesională. 

1910 Se creează Asociaţia Internaţională de Psihanaliză. J.M.Cattell prezintă în „Mind" prima serie de 
10 instrumente psihologice, feste mentale experimentate pe studenţii Universităţii Pennsylvania. 

1911 apare a III-a scală de inteligenţă Binet - Simon. 

1912 William Stern inventează ideea de quotient intelectual, apelând la evaluarea nivelului actual de 
inteligenţă prin distanţa dintre vârsta reală şi vârsta mentală, evaluare considerată de autor predictivă 
pentru performanţele ulterioare ale subiectului testat. 

1916 Izard şi Simon, prima scală de dezvoltare pentru prima copilărie. 

1917 Utilizarea testului Army Alpha si Beta Examination pentru testarea pe populaţii largi ale armatei 
S.U.A.. primul test colectiv nonverbal. Gesell realizează un sondaj mental al şcolilor elementare. 

1918 Woodworth dezvoltă primul inventar major de personalitate, pentru screening-ul recrutilor din 
armata americană în privinţa normalitatii şi dificultăților de adaptare. 


După primul război mondial, testele devin o practică de masă, cu cea mai largă răspândire în S.U.A. 
(selecția copiilor dotați, selecţia şi orientarea recrutilor) şi Franţa (orientarea şcolară şi problematica 
vârstei mentale a copilului şi adultului). 

Rorschach publică Psihodiagnosticul, introducând utilizarea a zece planşe cu pete de culoare pentru 
evaluarea bolii mentale. 

1922 J.M. Cattell stabileşte Corporaţia Psihologică, o primă firmă de publicare de teste şi consultanţă. 
1923 Se publică Testul de Dezvoltare mentală Stanford, inaugurând în America testarea elevilor de 
şcoală. 

1926 Florence Goodenough publică testul Desenati un Om, test pentru evaluarea abilităților mentale. 
1926 E.K.Strong publică Testul de interese rocationale. 

1928 Hartshorne şi May publica prima serie de cercetări. Studii privind înşelăciunea, care includ teste 
situationale şi care prezintă o consistenţă scăzută a „trăsăturilor de caracter" de-a lungul diferitelor 
situaţii. 

1934 Moreno publică Cine va supraviețui, introducând sociometria, măsurarea modelelor atitudinilor 
şi acţiunilor de grup. 

1935 Thorndike dezvoltă tehnica de analiză factorială şi o utilizează pentru determinarea abilităților 
primare. 

1936 Doll publică Scala de maturitate socială Vineland pentru evaluarea funcționării retardului 
mental. 

1936 in U.R.S.S. se interzice folosirea testelor psihologice. 
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1938L. Bender introduce Testul Vizual - motor de gestalt Bender, pentru evaluarea gradului de 
maturizare, a deteriorării creierului şi a personalităţii. 

1938 H. Murray şi colaboratorii publică Explorări ale personalităţii, incluzând date despre tehnici de 
măsurare, inclusiv Testul de aperceptie tematică, T.A.T., început în 1935. 

1939 L. Frank introduce termenul de „tehnici proiective" pentru probele cu stimuli ambigui asupra 
cărora subiectul „proiectează" stările şi nevoile interioare 

1942 Hathaway şi McKinley publică Inventarul multifazic Minnesota, M.M.PI., primul instrument 
complex de evaluare diferenţială a patologiei mentale. 

1949 A. Davis consideră că testele de inteligenţă suportă influenţa gradului de cultură al subiectului, 
deci sunt incorecte fata de cei cu nivel economic scăzut. 

1954 P. Meehl publică Predictie clinică versus statistică, demonstrând că formulele statistice 
egalizează sau îmbunătăţesc evaluările experţilor. 

1955 Meehl şi Cronbach propun validitatea de construct. 

1957 Edwards demonstrează influenţa dezirabilitatii sociale asupra răspunsului la itemii de 
personalitate, inițiind controversa asupra set-ului de răspuns. 

1957 Cronbach şi Geser lărgesc teoria testelor incluzând luarea deciziei şi problema valorilor 
instituţionale vs. individuale. 

1957 Campbell şi Fiske propun validarea convergentă şi discriminatorie şi procedura multitrăsătură - 
multimetodă în dezvoltarea testelor. 

1959Guilford propune o structură tridimensională a intelectului care cuprinde 120 de abilităţi speciale 
măsurabile prin proceduri specifice 

1963Glase propune testarea cu referinţă la criteriu, opusă testării cu referinţă la normă. 

1966 Asociaţia Psihologilor Americani publică Standardele pentru Testele şi Manualele Educationale 
şi Psihologice. 

1969 A.P.A. introduce ghidurile pentru testarea celor ,,dezavantajati". 

1969 Interpretarea automatizată a testelor, raportul lui Butcher asupra M.M.P.I. 

1969 Utilizarea computerelor interactionand cu clienţii, Super „Consilierea asistată de computer". 
1969 In S.U.A., cazul Griggs vs. Duke Power, Curtea Federală decide că testele utilizateîn selecţia 

profesională trebuie să demonstreze relevanta pentru profesia dată. 

In decursul anilor sfârşitului de secol au evoluat mult atât metodologia construirii şi aplicării 
testelor psihologice, cât şi concepţia asupra psihodiagnozei în sensul evaluării formative. 

Orientările contemporane se diferenţiază prin nivelul aparaturii statistice din ce în ce mai 
sofisticate care în prezent permite cuantificări nu numai ale dimensiunilor izolate, ci şi ale 
interacțiunilor simple sau complexe dintre acestea. Astfel, în măsurarea personalității s-a Irecut de la 
modelele uni şi bidimensionale la modele factoriale circumplexe cu trei sau mai multe dimensiuni. 
Dezvoltarea cercetărilor privind analiza de item, fidelitatea şi validitatea au introdus noi viziuni asupra 
calităţilor metrologice ale testelor psihologice şi utilizării lor în diferite tipuri de aplicaţii. S-au 
introdus periodizarea etalonării şi reetalonării testelor, precum şi necesitatea reviziei. S-au construit şi 
experimentat în funcție de diferite tipuri de teorii asupra abilităţilor umane şi a personalităţii, o larga 
paletă de instrumente de testare. S-au dezvoltate standarde de testare psihologică obligatorii în 
diferitele state ale lumii. 


2.3 CONTINUITATE ŞI DISCONTINUITATE ÎN EVOLUȚIA PSIHODIAGNOSTICULUI 
IN ROMANIA 


Nu s-a realizat încă o lucrare de istorie a psihologiei care să se refere explicit la evoluţia 
psihodiagnozei. Lucrări importante în tematica dezvoltării ştiinţei psihologice în România ante şi 
postbelică au scris M.Bejat, 1972, T.Herseni, 1980, I. Mânzat, 1994, G.Nicola, 2002. Primele cercetări 
în care s-au utilizat instrumente şi probe psihologice sau psihofiziologice s-au desfăşurat prin 
intermediul laboratoarelor de psihologie experimentală. In România, primul laborator de psihologie a 
fost deschis la laşi în 1893, sub conducerea lui Eduard Gruber. Doctor în N 
psihologie, Gruber deschide în 1893 şi primul curs de Psihologie experimentală. In ultimul deceniu al 
secolului XIX au apărut mai ales lucrări de cercetare în limba română sau în limbi străine, dar şi 
lucrări relevante pentru spiritul novator european în domeniul experimental: Introducere în 
psihofizică. Şt. Michlăiescu Principii de psihologie, (C.Leonardescu), Problemele psihologiei, 
(C.Rădulescu-Motru). De numele lui Rădulescu-Motru se leagă şi primul curs de Psihologie 
experimentală la Bucureşti - Elemente de psihologie experimentală. O dată cu anul 1906 obţine 
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fonduri pentru înfiinţarea primului laborator de psihologie experimentală la Universitatea din 
Bucureşti. 

In România, perioada interbelică a semnificat un început promiţător. Profesorul Rădulescu- 
Motru reluase în 1919 Cursul de psihologie la Universitatea din Bucureşti. In psihologie oferă un 
model de interpretare psihologică; de exemplu, modelul de explicare a transferului de energie de la 
forme simple la forme complexe, cristalizare teoretică ce a avut reverberatii semnificative în 
psihologia epocii. 

In 1919 se înființează Universitatea din Cluj, iar profesorul FI. Ştefănescu-Goangă, şef al 
catedrei de psihologie, edifică Institutul de cercetări în 1921 şi începe demersul pentru înfiinţarea unei 
secții de psihologie aplicată în cadrul căreia psihodiagnoza apare în prim plan (metode, teste 
experimentate şi etalonate etc.). De asemenea, inițiază o serie 'de servicii de psihologie aplicată la 
calea ferată, armată, poştă, instituţiile juridice şi de reeducare, în sănătate şi educaţia specială, dar şi în 
educaţia diferențiată orientată spre performanţă. In 1929, 1933 publica Selectiunea capacităților şi 
orientarea profesională. Formează şi susţine dezvoltarea ca cercetători şi practicieni a unor discipoli 
importanți precum: N. Mărgineanu, D. Tudoran, Al. Roşca, M. Beniuc. în problema specifică a 
psihodiagnozei, centrarea cercetărilor clujene este pe etalonarea şi adaptarea testelor psihologice, 
muncă vastă în care conlucreaza şi profesori şi psihologi din Bucureşti: Gh. Zapan, G. Bontila şi I. 
Nestor. 

Perioada de după cel de al II-lea război mondial a semnificat stagnare şi regres. Nu s-au realizat 
revizii ale metodologiei psihodiagnozei în ultimii 50 de ani. Sunt relativ puţine încercările de a crea 
noi teste. Au apărut în perioada postbelică puţine lucrări privind testarea psihologică, cele publicate 
având fie un caracter didactic, fie un caracter general. Au existat preocupări în cadrul laboratoarelor 
industriale de realizare a unor monografii profesionale şi a unor psiho-profesiograme aplicabile în 
selecţia şi orientarea profesională. Laboratoare au existat în industrie, aviaţie, armată, clinică, precum 
şi în centrele universitare din Bucuresti, Cluj, Iasi şi Timişoara. Consilierea şcolară şi profesională, 
începută strălucit în perioada interbelică, s-a diminuat treptat până la dispariție. După 1983, o dată cu 
conul de umbră în care au fost aruncate psihologia şi munca psihologilor din România, activitatea 
aplicativă şi formativă s-a restrâns deosebit de mult. 

In prezent este marcantă tendinţa de a computeriza activitatea de evaluare psihologică (aplicare, 
scorare, interpretare). 

Se răspunde mai putin semnificativ tendinței actuale în plan international de a se reduce perioada 
dintre ultima revizie a testului şi cea curentă. 

S-a început construirea unor noi instrumente. Dacă. în plan internațional, testele de 
psiholingvistică Big Five, precum şi Bateriile multidimensionale de aptitudini sunt o preocupare 
actuală, în România au început demersuri paralele (testul ABCD-M de tip Big Five), dar se 
accentuează mai ales pe teste specifice şi situationale de selecție profesională adecvate unor locuri de 
muncă particulare (aviaţie etc). S-au realizat mai ales chestionare cu o aplicabilitate restrânsă. 

In plan internaţional, se construiesc noi instrumente de testare pentru arii aplicative precum 
diagnoza formativă, psihologia clinică, psihologia comportamentului sau psihologia ecologică; în 
România această preocupare este relativ restrânsă şi depinde mai ales de interesul specific al unui 
profesionist. 

în plan internaţional, tendinţa este de a completa echipamentul lestului cu noi studii privind 
fatetele validității şi utilitatea acestuia; manualul tehnic include aceste informaţii privind 
caracteristicile metrologice, dar şi rezultate ale cercetărilor privind aplicaţiile şi interpretarea 
scorurilor. Apar ghiduri privind utilitatea aplicării testelor în diferite arii aplicative. Aceste aspecte 
sunt neglijate şi nu există încă preocupări metodologice convergente şi nici pentru publicarea 
manualului testului cu cercetările aferente. Apar sporadic articole în revistele de specialitate privind 
unele experimentări de teste (E.P.I., C.P.I.. etc). 

Există slabe preocupări în România privind creşterea valorii fidelității şi a validității probelor 
utilizate (N. Mitrofan, 2001). De asemenea, slabe preocupări de experimentare şi standardizare a 
testelor pe întreaga populaţie (excepţie grupul de cercetare Cluj pentru testele C.P.I. Wonderlic, 
E.P.Q., şi grupul de cercetare Bucureşti, testul screening Denver, NEO-PI-R, M.B.T.I.). 

Există slabe preocupări pentru luarea măsurilor de protecție legală a instrumentului 
psihodiagnostic şi prevenirea situaţiilor în care să se limiteze/permită accesul la teste profesionale şi la 
interpretarea rezultatelor, pentru persoane neformate profesional. In acest sens, o importanţă decisivă 
o are în prezent preocuparea Asociaţiei psihologilor din România de a impune nu numai recunoaşterea 
profesiei, ci şi. mai ales, a unei Legi privind exercitarea profesiunii de psiholog, constituirea unui 
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Consiliu al psihologilor care să impună respectarea metodologiilor în evaluarea psihologică şi 
aplicarea Codului deontologic al profesiunii. 
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3. CODUL DEONTOLOGIC AL PRACTICĂRII PSIHODIAGNOZEI 


3.4. Legi, standarde şi reglementări privind testarea educaţională şi psihologică. Situaţia din 
ţară noastră. 

3.5. Responsabilitati în construirea testelor, publicare şi comercializarea acestora 

3.6. Responsabilitati în aplicarea testelor şi utilizarea rezultatelor 
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1.1. LEGI STANDARDE ŞI REGLEMENTĂRI PRIVIND TESTAREA EDUCAȚIONALĂ. SI 
PSIHOLOGICĂ 


Asociaţiile psihologilor din diferite tări au construit o serie de norme asamblate în coduri deontologice 
valabile pentru conduita profesională a psihologului şi a oricarei persoane implicate în funcţii 
profesionale de psihologie. 
Comportamentul profesionist şi responsabilitatile în utilizarea modalitatilor de evaluare psihologică 
pot fi privite din trei perspective: 

e Probleme legale 

e Probleme etice 

e Probleme profesionale 
În consecință discutăm de: 

e Jegi, 

e standarde etice şi 

e standarde profesionale. 
Acestea formează un continuum de standarde ce privesc diferite laturi ale comportamentului 
profesional. Documentele legale despre testare sunt în general mai vagi dar influenţează standardele 
profesionale privind conduita şi practicile profesionale în evaluare şi testare. Codurile etice şi ghidurile 
profesionale, principiile şi standardele aferente sunt dezvoltate pentru a educa şi ghida profesioniștii în 
activitățile concrete. 


Primul cod etic 
Primul cod etic formal pentru evaluarea psihologică a fost adoptat de Asociaţia Psihologilor 
Americani în anul 1952. Cu titlu exemplificativ, din cele 100 de principii etice, 18 se adresează 
utilizării testelor psihologice, acoperind următoarele domenii: 
e Calificarea celor ce utilizează teste- 3 principii 
Responsabilitatile psihologului- 4 principii 
Responsabilitatile şi calificările celui care publică teste- 3 principii 
Condiţia ca testul să fie considerat terminat- 1 principiu 
Modul de descriere a testului in manual şi publicatii- 5 principii 
e Securitatea materialelor testului- 2 principii 
În anii 1980 majoritatea asociaţiilor psihologice din lume au adoptat standarde etice şi coduri 
profesionale care se referă şi la domeniul măsurării şi evaluării psihologice. 


1.1.1. TIPURI DE STANDARDE 


Informaţiile privind istoricul reglementărilor în alte tări sunt utile pentru a evalua unde ne aflăm acum 
şi cum trebuie să privim activitatea psihologică în context social, învățând din experienţele relevante 
pe plan mondial. Tradiția cea mai mare în domeniu o are activitatea psihologică din S.U.A. 

În anul 1985, în S.U.A. au fost elaborate şi adoptate un set de norme etice şi standarde de utilizare a 
testelor psihologice şi de practicare a examinărilor psihologice sub titulatura: „Standards for 
Educational and Psychological Testing” . La elaborarea lor au contribuit trei instituţii The American 
Educational Research Association(A.E.R.A.), The American Psychological Association (A.P.A.) şi 
The Nacional Council on Measurement in Education (N.C.M.E.). Standardele publicate pentru prima 
oară în 1952 au fost revizuite succesiv în 1966, 1974, 1985 şi 1999. În aceste standarde sunt vizate atât 
caracteristicile psihometrice ale testelor cât şi comportamentul profesional al psihologului, insistându- 
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se asupra faptului că acestora le revine responsabilitatea profesională de a apăra bunăstarea 
psihologică a persoanelor testate. 

Legile care se referă la testare au ca principal scop protejarea anumitor segmente ale publicului de 
abuzurile specifice. 

Standardele etice şi codurile sunt mai specifice şi încearcă să stabilească norme mai înalte pentru o 
gamă mai largă de profesionişti, care trebuie să se raporteze în activitatea lor în primul rând la codul 
etic. 

Standardele profesionale, principiile şi ghidurile sunt orientate în general spre probleme mai tehnice 
pentru a-i ghida pe cei care utilizează testul fata de aplicaţii specifice şi utilizări ale evaluărilor. Spre 
exemplu aceste standarde răspund unor problematici legate de dezvoltarea, validarea şi utilizarea 
evaluărilor, de utilitatea testului, de corectitudinea sa, de felul cum face faţă constrângerilor practice. 


În completarea Standardelor din 1985 au apărut prevederi specifice pentru domenii particulare, spre 
exemplu: 
Special Guidelines(APA, 1981)- pentru psihologii clinicieni, organizaţii industriale, şcoli sau în 
consiliere 
Principles for The Validation And Use of Personnel Selection Procedures (Society For Industrial And 
Organizational Psychology, 1987)- pentru selecţia profesională 
Guidelines For Computer-Based Tests And Interpretations (APA; 1986)- pentru folosirea 
calculatorului in testarea psihologica 
Ethical Principles and Code of Conduct(APA, 1992)- cod deontologic specific evaluarii psihologice. 
Câteva din aspectele cuprinse in codul deontologic(APA, 1992): 
e Evaluarea psihologică şi psihodiagnosticul trebuie să se facă numai într-un cadru profesional, 
de către utilizatori competenţi şi cu experienţă în domeniu, cu ajutorul unor teste potrivite 
e Pentru proiectarea şi selectarea tehnicilor adecvate se vor folosi proceduri ştiinţifice 
e Interpretarea rezultatelor şi explicarea acestora se va face cu mare atenţie 
e Se va actiona pentru păstrarea securităţii testelor 
Prezentăm spre exemplificare problematica abordată de Standardele A.P.A. privind calificarea 
utilizatorilor de teste(adoptate în anul 2000), care vin în completarea şi specificarea celorlalte 
standarde, şi a căror necesitate a apărut din observaţia că majoritatea dificultăţilor legate de teste 
provin din insuficienta calificare a utilizatorilor. Câteva probleme din cuprinsul acestora: 
Cunoştinţe şi abilităţi esenţiale pentru utilizatorii de teste 
e Cunoştinţe privind psihometria şi măsurarea psihologică 
Selectarea testelor, procedurilor adecvate 
Proceduri de administrare a testelor 
Influenţa variabilelor etnice, rasiale, culturale, de sex, de vârstă şi lingvistice 
Testarea persoanelor cu disabilităţi 
e Experienţa supervizată 
Calificări necesare pentru contexte specifice 
e În contextul ocupational 
e În contextul educational 
e În contextul consilierii ocupaţionale, vocationale 
e În contextul sănătăţii 
e În contextul justiţiei 
În ceea ce priveşte capitolul “Cunoştinţe privind psihometria şi măsurarea psihologică”, standardele 
precizează ariile de cunoştinţe, din care redăm o parte: 
e Cunoştinţe despre teoria clasică psihometrică şi teoria răspunsului la item 
e Statistica descriptivă- distribuții de frecvete, măsuri ale tendinței centrale, măsuri ale variaţiei, 
indicele de relatie(corelatia datelor) 
e Scale, scoruri şi transformări- tipuri de scale(nominale, ordinale, de interval, de proporţie), 
tipuri de scoruri(brut, transformat- percentile, standard, normalizate) 
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e  Fidelitatea şi erorile de măsură- surse de variabilitate sau erorile de masuratoare(caracteristicile 
examinatului, caracteristicile testului, caracteristicile constructului şi intenţia de utilizare a 
scorurilor, caracteristicile şi comportamentul examinatorului, caracteristicile mediului în care 
se face testarea, procedurile de administrare a testului, acurateţea scorării), tipuri de fidelitate şi 
adecvarea lor pentru diferite tipuri de teste şi utilizări ale testelor(fidelitatea test-retest, 
fideliatea calculată prin formele paralele sau alternative ale testelor, consistenţa internă, 
fidelitatea interevaluatori), eroarea standard a măsurătorii(SEM) 

e Validitatea şi semnificaţia scorurilor la teste- tipuri de dovezi care contribuie la validitatea de 
construct (de conţinut, de criteriu, convergentă, discriminativă), interpretarea normativă a 
scorurilor la teste(tipuri de norme şi relevanta lor pentru interpretarea rezultatelor — scoruri 
standard sau scoruri percentile), caracteristici ale grupului normativ şi limite în generalizarea 
rezultatelor, tipuri de referenti ai scorurilor (norma, domeniul- criteriul, autoreferentiale- scalele 
ipsative), tabelele de expectante. 


SITUAŢIA DIN TARA NOASTRĂ 

În România în anul 2004 a fost adoptată şi a intrat în funcţiune legea care reglementează 
profesia de psiholog, cu denumirea completă: „Legea nr. 213 din 27 mai 2004, privind exercitarea 
profesiei de psiholog cu drept de liberă practică, înființarea, organizarea şi funcţionarea Colegiului 
Psihologilor din Romania”. 

Această lege trebuie să fie cunoscută de orice psiholog din România, incluzându-i şi pe cei care 
se află în proces de formare (studenţii, masteranzii). În baza ei s-a înfiinţat Colegiul Psihologilor din 
România, iar în cadrul Colegiului funcționează patru comisii aplicative, şi încă două comisii, una 
metodologică şi una deontologică, respectiv: 

e Comisia de psihologie clinică, consiliere psihologică şi psihoterapie; 
Comisia de psihologie a muncii, transporturilor şi serviciilor; 
Comisia de psihologie educaţională, consiliere şcolară şi vocationala; 
Comisia de psihologie pentru apărare, ordine publică şi siguranţă națională. 
Comisia metodologică 

e Comisia de deontologie şi disciplină. 

Comisia metodologică are atributiuni mai apropiate de activitatea psihodiagnostică este 
elaborând deja „Normele de avizare a metodelor şi tehnicilor de evaluare şi asistenţă psihologică”. 
Conform art.3 (1) Comisia Metodologică a Colegiului Psihologilor din România, prin normele de 
avizare prezente, stabileşte standardele de calitate şi procedurile de avizare pentru metodele şi 
tehnicile de evaluare şi asistenţă psihologică. Pe de altă parte, conform art. 3(2) „Comisiile aplicative 
din cadrul Colegiului Psihologilor din România, prin normele de avizare specifice, atestă competențele 
profesionale ale psihologilor de a utiliza metode şi tehnici de evaluare şi asistenţă psihologică. Toate 
comisiile de specialitate vor avea în vedere competențele generale de utilizare a testelor psihologice 
precizate în documentul de faţă”. 

De o mare importanţă sunt precizările referitoare la dreptul de utilizare a testelor psihologice. 
Cei care folosesc testele trebuie să fie în posesia unor competenţe bine precizate, identice cu cele 
prezentate în Standardele APA pentru calificarea utilizatorilor de teste(2000), care se obţin prin 
procesul de formare profesională, însemnând şi anii de studiu şi de practică din facultate, dar şi 
procesul de formare postuniversitară. 

Categoriile majore de competenţe vizează următoarele aspecte etice în aplicarea testelor: 

e adoptarea unei conduite profesioniste, în acord cu normele deontologice ale psihologului şi cu 
respectarea legilor internaţionale şi naţionale privind copyright-ul (legea drepturilor de autor şi 

a drepturilor conexe — nr. 8/1996); 

e utilizarea doara acelor teste pentru care au competenţa necesară; 
e asumarea responsabilitatii pentru modul de utilizare a testelor; 
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e asigurarea securităţii pentru testele utilizate, astfel încât ele să nu-şi piardă calităţile din cauza 
deconspirării publice a conţinutului ori a mecanismelor de cotare; 
e asigurarea confidentialitatii rezultatelor; 
e acordul scris sau în formă electronica de includere a rezultatelor în baza de date a utilizatorului 
probei psihologice. 
De asemenea, această comisie a elaborat o serie de norme referitoare şi la modul de 
comercializare a testelor. 


1.2. RESPONSABILITĂȚI PRIVIND CONSTRUIREA TESTELOR, PUBLICAREA SI ACCESUL 
LA ACESTEA 


După standardele din ghidurile tehnice testul psihologic este: 

e Un instrument de interpretare utilizat de psihologi, formând o bază pentru o inferenta care 
depăşeşte conţinutul itemului 
Se bazează pe principii ştiinţifice 
Are proprietăţi psihometrice cunoscute şi evaluate 
Poate fi folosit pentru o varietate de întrebuințări 
Poate fi folosit de profesionişti care nu sunt psihologi şi chiar utilizat de profesionişti care nu 
sunt psihologi, dar care trebuie să fie capabili să-l folosească pentru scopuri psihologice, 
respectând principiile etice ale practicii psihologice 


Standardele tehnice cuprind norme pentru construirea testului ce se referă la dovezi ştiinţifice privind 
validitatea, gradul de încredere şi erorile măsurătorii, cercetările privind dezvoltarea şi revizia testului, 
scalarea şi stabilirea normelor, comparabilitatea scorurilor, standardele de publicare. 
Există două tipuri acceptate de utilizatori: 

e Utilizatorul primar de teste 

e Utilizatorul secundar 
Utilizatorul primar este profesionistul psiholog. Utilizatorul secundar poate fi o altă persoană care are 
acces la teste, care nu are formare în măsurare şi evaluare, dar care, mai ales în domeniul educaţional, 
poate avea nevoie de teste, distorsionând sau interpretând greşit rezultatele testelor. Astfel utilizatorul 
primar este implicat, de regulă, în îmbunătățirea utilizării testelor, informarea şi influențarea şi 
grupurilor de utilizatori secundari. Codul pentru practici corecte în educaţie, în S.U.A. a apărut într-un 
astfel de context. 

În privinţa calităţii instrumentelor şi a procedurilor de măsurare, normele prevăd obligaţia 
psihologului de a citi manualul testului pentru a determina dacă: 

e Testul este adecvat scopului urmărit 

e Testul este potrivit caracteristicilor celor examinati 

e Calitățile testului sunt acceptabile 

e Daca are validitate de aspect 


Privind distribuirea testelor, firmele care produc şi distribuie teste psihologice sunt obligate să 
acorde atenţie prevederilor legale privind controlul distibuirii testelor, numai către utilizatorii calificaţi 
profesional, cu diplomă de licenţă în psihologie(ex. Franţa, România), sau şi celor în curs de formare, 
dacă există un supervizor care îşi asumă răspunderea pentru utilizarea testelor de către cumparator(Ex. 
Olanda). Asociaţia Psihologilor Americani a manifestat întotdeauna grijă pentru ca testele să fie 
aplicate la un nivel înalt ştiinţific, dar numai de către cei calificați pentru aceasta. Astfel APA 
clasează instrumentele psihologice în trei clase de accesibilitate profesionala : A, B şi C, clasificare 
care implică şi distribuirea testelor. În principiu, modelul ABC al APA stipuleaza că instrumentele 
psihometrice nu sunt accesibile decât utilizatorilor calificaţi. 

Un test de nivel A poate fi achiziţionat de orice entitate, organizaţie sau instituţie, 
precum şi de orice persoană , indiferent de calificarea ei profesională . De obicei testele 
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de calificare A, care nu cer o anumită formare profesională , sunt destinate uzului în 

business sau în zona educaţională . Testele de clasa A nu sunt de obicei instrumente 

foarte puternice ori foarte documentate. Acestea pot fi administrate, scorate şi interpretate adecvat cu 
ajutorul manualului şi al unei orientări generale (de exemplu, teste de achiziţie). 

Instrumentele de nivel B sunt destinate acelor indivizi care au absolvit studii universitare cu 
profil psihologic ori asimilate acestora(asistenta socială, psihosociologie, psihopedagogie specială). 
Aceasta este o concesie făcută situației din România, deoarece standardul APA stabileşte 
accesibilitatea instrumentelor de tip B exclusiv după absolvirea unui curs de psihometrie la nivel de 
Master, precum şi (condiții cumulate!) training specializat sub supervizarea unui psiholog calificat. 
Testele de nivel B reclamă anumite cunoştinţe tehnice privind construirea şi utilizarea testelor, precum 
şi cunoştinţe din alte domenii ale psihologiei, precum: psihologia diferenţială, statistica psihologică, 
psihologia personalului, psihologia adaptării, orientarea vocationala (de exemplu, teste de aptitudini, 
inventare de adaptare aplicabile populaţiei normale). Majoritatea inventarelor de personalitate sunt 
clasate B. 

Instrumentele de clasa C sunt destinate exclusiv indivizilor care au obținut titlul 

doctoral în psihologie sau educaţie, sau care sunt membri ai unor organizaţii profesionale care îi 
califică pentru uzul respectivului test, ori care lucrează sub supervizarea directă a unui psiholog 
calificat pentru uzul respectivului test. Aceste teste solicită cunoştinţe de înalt nivel privind testarea şi 
din alte domenii de suport, la care trebuie să se adauge supervizarea din partea unor specialişti în 
aceste domenii (de exemplu, teste proiective, teste de inteligenţă individuale). Testele clinice (MMPI 
şi Rorschach de exemplu) precum şi o parte din testele de abilităţi cognitive(Weschler) sunt clasate C, 
primele datorită experienţei profesionale necesare, cele din urmă mai degrabă datorită finetii 
deontologice necesare în înţelegerea şi comunicarea rezultatelor. 
Este important de remarcat că există o multitudine de factori care sunt luaţi în considerare în judecarea 
nivelului de calificare al unei persoane, pe lângă formarea sa profesională. Se consideră calitatea de 
membru în organizaţii profesionale cu activitate în zona psihologiei sau consilierii, calitatea de angajat 
al unei instituţii active în aceste zone, experiența generală în testare şi în psihometrie, precum şi 
utilizarea intenţionată a testului. 

În S.U.A., în Ethical Principles of Psychologists (1992) sunt făcute precizări şi mai clare 
privind calificările utilizatorilor de teste. Astfel, Principiul A afirmă că psihologii „oferă numai acele 
Servicii şi utilizează numai acele tehnici pentru care sunt calificați prin educaţie, formare sau 
experienţă. Standardul etic 2.02 adaugă: „psihologii se abtin de la utilizarea necorespunzatoare a 
tehnicilor de măsurare şi, totodată, iau măsuri pentru a preveni ca alţii să utilizeze defectuos informaţia 
pe care o oferă aceste tehnici”. 

Cu toate măsurile luate s-a constatat că, în practică, se întâlnesc frecvente abateri. De aceea, APA, 
împreună cu The American Research Association, The National Council on Measurement in 
Education şi cu foarte multe edituri ce publicau teste, a înfiinţat The Joint Committee on Testing 
Practice (JCTP). Acesta a adoptat, in 1988, The Code of Fair Testing Practices in Education, care 
descrie obligaţiile celor care construiesc teste, precum şi ale celor ce le aplică, in patru arii: a) 
dezvoltarea/selectarea testelor; b) interpretarea scorurilor; c) strădania pentru corectitudine; d) 
informarea subiecţilor. 


1.3. RESPONSABILITĂȚI ÎN APLICAREA TESTELOR ȘI ÎN UTILIZAREA REZULTATELOR 


Pentru activitatea specifică testării psihologice (aplicarea, administrarea) normele nationale şi 
internaţionale reglementează: 

e Calificarea examinatorului 

e Calitatea procedurilor şi instrumentelor de măsurare 

e Obținerea consimţământului subiectului pentru examinarea psihologică 

e Confidentialitatea rezultatelor 
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e Modul de comunicare a rezultatelor 
e Specificarea efectului discriminatoriu al testului asupra grupelor minoritare 


O să luăm în discuţie pe cele mai importante dintre acestea. 
Calificarea examinatorului este specificată, spre exemplu în S.U.A., în Standardele pentru calificarea 
examinatorilor, aprobate şi publicate în anul 2000, înfăţişate pe scurt în capitolul anterior. În plus 
trebuie menţionat că fiecare catalog care prezintă teste specifică şi nivelul de competenţă necesar 
cumpărării şi utilizării fiecărui test. Utilizatorii trebuie să aplice testele numai conform indicatiilor date 
de autorii lor. Despre calitatea procedurilor de examinare se specifică interdicţia de a examina în 
condiţii necorespunzătoare şi în situaţia în care subiecţii prezenţi la examinare nu sunt pregătiţi sau nu- 
şi dau consimțământul. 
Obţinerea consimtamantului include obligaţia psihologului de a explica motivul examenului, în 
unele ţări acordul fiind realizat într-o formă scrisă, semnată de ambele parti. De aceea se face 
adăugirea- consimtamant informat, însă, pentru a nu afecta rezultatele examinării, nu se dau explicaţii 
detaliate despre test, când intruziunea în viaţa particulară este minoră. 
Confidenţialitatea rezultatelor se referă la accesul strict limitat pentru informaţia furnizată de testul 
psihologic. În afară de câteva exceptii- când persoana este un pericol pentru sine si pentru alţii, sau 
este vorba de selecţie psihologică- informaţia nu va fi comunicată altei persoane. Chiar şi atunci când 
trebuie comunicată- acces au managerul, sub forma interpretată, medicul, avocatul, psihoterapeutul 
care se ocupă de persoană. Datorită surselor de eroare ce pot afecta semnificaţia rezultatelor 
subiectului i se poate da posibilitatea de a corecta ceea ce consideră a fi o imagine nefavorabilă sau 
discordantă cu performanţele sale reale. Trebuie evitată afişarea rezultatelor examenului psihologic, 
recomandându-se afişarea doar a persoanelor admise. 
Comunicarea rezultatelor se face doar sub forma lor prelucrată şi interpretată, sub formă de raport 
psihologic, conform cerinţelor beneficiarului. Raportul trebuie să fie clar, fără ambiguitati, evitandu-se 
utilizarea termenilor tehnici, care pot antrena erori de înţelegere din parte unor neprofesionisti. În 
raport se explică semnificaţia rezultatelor şi posibilele implicaţii, în termeni comportamentali, 
relevanti pentru scopul examenului, cu posibilitatea unei predicții pe un termen scurt, în general şase 
luni, pentru anumite contexte. În general se evită formularea în termeni de certitudine, preferându-se 
formulări relativizante, de genul: „în general”, „în anumite contexte”, „este posibil ca”, „este probabil 
să”. Datele comunicate trebuie să reflecte situaţia cât mai obiectiv, fără păreri subiective sau strict 
personale, ţinând cont de toate informaţiile oferite de test, situaţia de testare, observaţia pe timpul 
testării şi caracteristicile psihometrice ale testului. 
Posibilitatea discriminărilor intervine mai ales când proba este utilizată în selecţia profesională şi se 
utilizează un singur prag de admisibilitate. Dacă există grupuri minoritate care obţin scoruri mai mici 
decât alte grupuri, persoanele care fac parte din acestea au şanse mai mici să fie selectate şi astfel pot 
fi discriminate. În acest sens sunt prevăzute şi standarde pentru aplicaţiile particulare ale testelor, spre 
exemplu testarea lingvistică a minorităților etnice şi testarea persoanelor cu disabilităţi, dar nu numai. 
Însă situaţia discriminării reale apare numai dacă persoanele ar obţine şi performanţe echivalente în 
munca respectivă, spre exemplu în selecția de personal, iar rezultatele la teste ar fi influențate doar de 
un criteriu care nu are relevanţă pentru performanţa viitoare (spre exemplu diferențele datorate sexului 
la un examen psihologic la aviaţie, sau pentru postul de secretară când la examen se prezintă un 
bărbat, sau cele legate de limba de examinare- atunci când performanţa nu depinde de abilităţile 
lingvistice sau de cultură). Pentru a preîntâmpina astfel de erori se calculează ecuaţia de regresie 
pentru grupul majoritar şi pentru cel minoritar, iar dacă este aceeaşi atunci testul nu face discriminări, 
deci rezultatele la test prognostichează performanţe mai slabe. Dacă diferă atunci se pot fixa praguri de 
admisibilitate mai scăzute pentru grupurile minoritate respective (cutoff score). 
În ceea ce priveşte testele educaţionale, preocupări destul de recente includ în standardele de 

utilizare reglementări privind: 

e  Notificarea anticipată a standardelor de conţinut dar şi de nivel al performanţei la testele 

respective 
e Determinarea posibilităţii ca elevii să-şi însuşească cunoştinţele şi abilităţile cerute 
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e Antrenarea în scopul atingerii succesului- familiarizarea cu tipul de sarcini, inclusiv cu 
modalitatea practica de evaluare(de exemplu familiarizarea cu calculatorul, tezele unice care 
anticpează examenele) 

e Evaluarea reflectă practicile curente de instruire şi curriculare 

e Existenţa unei încrederi supra sau sub dimensionate în scoruri- informaţiile trebuie 
suplimentate cu alte informaţii din alte surse, iar performanţa trebuie interpretată într-un 
context mai larg 

e Luarea în considerare a fundalului cultural şi social al celui testat 

e Excluderea unei largi proporții de elevi sau studenţi care prezintă dificultăți sau disabilităţi 
lingvistice din studiile şi normele care monitorizează progeresul educaţional şi permit 
comparații sistematice(testarile pe scară largă), duce la imagini şi standarde deformate 


Toate aceste aspecte privind codul deontologic al psihodiagnosticianului intervin în percepția socială 
gi creează imaginea unei ştiinţe eficiente şi obiective sau a ineficientiei şi amatorismului, promovând 
astfel încrederea şi utilizarea la nivel social sau dimpotrivă neîncrederea şi minimalizarea socială. De 
aceea este important să fie cunoscute şi aplicate de către toţi cei care profesează în domeniu. 
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4. TESTUL PSIHOLOGIC INSTUMENT DE BAZA ÎN EVALUAREA PSIHOLOGICĂ 


4.5. Definiţii ale testului psihologic din diferite perspective 

4.6. Clasificări ale testelor psihologice 

4.7. Calitățile generale ale testelor şi echipamentul testului psihologic 
4.8. Selectarea celor mai adecvate teste pentru o situaţie 


DEFINIŢII ALE TESTULUI PSIHOLOGIC DIN DIVERSE PERSPECTIVE 


Etimologie 
Cuvântul test provine din latinescul testum, care semnifică o oală de pământ, capacul acesteia. 
Cuvântul test este legat de cuvântul cap, testa. Ca şi conotaţie a insemnat- încercare, probă, examen 
critic, piatră de încercare, mărturie.(Minulescu, M., 2003). 
Termenul de test este legat de cel de diagnostic psihic, care, la rândul lui, provine de la cuvântul 
grecesc diagnosticos, însemnând „apt de a recunoaşte”. Până la un anumit punct, diagnosticul psihic 
este similar cu diagnosticul medical, deoarece există o multitudine de caracteristici specifice. 
Observaţie: distincția făcută de unii autori între noţiunea de test şi chestionar de personalitate 
Acceptiunea incetatenita- test 

Vom trece in revistă mai multe definiţii ale testului psihologic, oferite de autori străini şi 
români: 

1.Conform definiţiei de lucru din „Standardele APA privind calificarea utilizatorilor de 
teste(2000) ”, "testul este o procedură de măsurare pentru evaluarea caracteristicilor psihologice ale 
unei persoane, în care un eşantion din comportamentul examinatului este obținut, evaluat, scorat, prin 
utilizarea unui proces standardizat”. 

2. Anne Anastasi şi Susana Urbina(1997) au o definiţie foarte asemănătoare: „Un test 
psihologic este în mod esenţial, o măsură obiectivă şi standardizată a unui eşantion de 
comportament.” 

3. Susana Urbina(2004) reia definiţia şi o completează “ Un test psihologic este o procedură 
sistematică utilizată pentru a obţine eşantioane de comportament, relevante pentru funcţionarea 
cognitivă sau afectivă a persoanei, şi pentru a transforma în scoruri şi a evalua aceste eşantioane în 
concordanţă cu anumite standarde. 

Merită subliniate şi definiţii ale altor autori importanţi în câmpul psihodiagnosticului. 

3. L.G.Cronbach (1966)(apud Minulescu, M., 2003): „Testul este o procedură sistematică de a 
compara comportamentul a două sau mai multe persoane” 

4. Pierre Pichot(1967): „Testele sunt instrumente de lucru standardizate servind de stimuli 
pentru un comportament, care, la rândul lui, poate fi evaluat prin compararea statistică cu 
comportamentul altor subiecţi aflaţi în aceeaşi situaţie, ceea ce permite clasarea subiectului examinat, 
fie cantitativ, fie tipologic”. 

5. Paul Oléron: „Testul este un instrument fundamental al psihologiei aplicate ce se 
caracterizează prin posibilitatea de a examina numeroşi indivizi în situaţii uniformizate”. 

6. A. Rey: „Testele psihologice sunt procedee standardizate, construite astfel încât să 
provoace la subiecţii investigati reacţii înregistrabile iar materialul obţinut prin intermediul acestor 
teste se estimează prin referinţă la valorile etalon” 

7. M. Roşca (1972): „Testul este o probă sau o serie de probe, construite în scopul stabilirii 
prezenţei (sau absenței) unui aspect psihic, a particularitatilor de manifestare comportamentală sau a 
gradului de dzvoltare psihică”. 

8. Grand dictionnaire de la psychologie (1994): „Testul este o probă, utilizată cu precădere in 
psihologia diferenţială, care permite descrierea comportamentului unui subiect într-o situaţie 
definită precis, prin raportare la comportamentul unui grup precis de subiecţi, plasați în aceeaşi 
situaţie standard. Descrierile se fac de obicei sub formă numerică”. 
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8. Tot A. Anastasi (1992): „Testul este o măsură obiectivă şi standardizată a unui eşantion 
de comportament”. 

9. Klausnitzer(1992): „Testul psihologic este o situaţie standardizată care generează un 
comportament semnificativ.” 

Conceptele cheie în aceste definiţii se referă, majoritatea, la obiectivitate, standardizare şi măsurarea 
unui eşantion de comportament. Vom proceda la o detaliere a acestor aspecte. 

Măsură obiectivă înseamnă, în principal, două aspecte: a) administrarea, cotarea şi 
interpretarea scorurilor sunt obiective în măsura în care acestea sunt independente în raport cu 
judecatile subiective ale examinatorului: b) obiectivitatea testului reiese din faptul că determinarea 
nivelului de dificultate al unui item ori a întregului test se bazează pe proceduri empirice, obiective şi 
nu pe nivelul de apreciere (deci, subiectivitate) a celui ce construieşte un test. 

Al doilea concept, măsură standardizată, înseamnă, de asemenea, mai multe aspecte: a) 
standardizarea implică uniformitatea procedurii în administrarea, cotarea şi evaluarea rezultatelor. 
Pentru ca scorurile diferitelor persoane să fie comparabile, condiţiile de testare trebuie, în mod 
evident, să fie aceleaşi pentru toţi. În vederea sigurării acestei uniformitati a condiţiilor testării, 
constructorul testului are obligaţia să ofere informaţii şi direcţii detaliate pentru administrarea fiecărui 
test nou. De altfel, formularea acestor direcţii este o parte majoră a standardizării unui test nou, 
deoarece ele se referă la: - materialele folosite; - instrucţiunile orale (instructajul); - demonstrațiile 
preliminare; - modalitățile de răspuns la întrebările şi neclaritatile ridicate de către subiecţi; - orice alte 
detalii privind situaţia de testare; b) un alt pas important în standardizare este stabilirea normelor, a 
etalonului, la care raportăm, după aplicarea testului, rezultatele obţinute de către subiect. Ceea ce 
obține concret la un test un subiect constituie scorul brut (raw score) şi el poate să exprime numărul 
corect de itemi, timpul cerut pentru îndeplinirea unei sarcini, numărul erorilor sau alte modalităţi de 
măsurare potrivite conţinutului testului. Acest scor nu spune nimic până nu îl raportăm la norme sau la 
etalon. (Cuvântul norme este preluat din limba engleză şi el este echivalent cuvântului etalon din 
limba română). 

În sfârşit, conceptul eşantion de comportament se referă la faptul că, în acţiunea de testare, 
vizăm o anumită secvenţă a comportamentului sau un anumit tip de comportament, cum ar fi, de 
exemplu: comportament inteligent, comportament creativ, comportament motric, comportament verbal 

10. O altă definiție dată testului psihologic de către Robert Gregory (apud Mitrofan, N., 2007), 
aduce elemente în plus: „Testul psihologic este o procedură standardizată folosită pentru eşantionarea 
comportamentului şi descrierea lui cu ajutorul categoriilor sau scorurilor”. Plecând de la această 
definiție, putem deduce faptul că majoritatea testelor prezintă următoarele caracteristici definitorii: a) 
procedura de standardizare; b) eşantionul de comportament; c) scoruri sau categorii; d) norme sau 
standarde; e) predicția comportamentului netestat, reprezentat de eşantionul testat. Procedura de 
standardizare este trăsătura esenţială a testului psihologic. Niciun examinator nu are voie să se abată 
de la setul de instrucţiuni şi de precizările privind modul de aplicare a testului existente în cadrul 
manualului. Acestea reprezintă o garanţie privind faptul că procedurile de administrare se aplică 
identic de către toţi. Esantionul de comportament este de interes în măsura în care el permite 
examinatorului să facă inferente asupra domeniului total al comportamentului. Un bun test trebuie să 
aibă capacitatea de a-i permite examinatorului să prognozeze alte comportamente şi nu pe cele 
reflectate de itemi. Aplicarea testelor se finalizează cu derivarea de scoruri sau de categorii. Deoarece 
în abordarea nomotetica se presupune că toți oamenii posedă trăsătura sau caracteristica ce urmează a 
fi măsurată într-o anumită „cantitate”, scopul testării psihologice este de a estima tocmai această 
cantitate, exprimată numeric. De asemenea, un test psihologic trebuie să posede norme sau standarde. 
Rezultatele obţinute de grupul de normare sau eşantionul de standardizare sunt grupate pe mai multe 
clase, stabilindu-se performanţa medie şi, totodată, ele servesc la indicarea frecvenţei cu care diferite 
scoruri cu valoare mai mare sau mai mică sunt obţinute. 

Deşi fiecare autor se opreşte asupra anumitor aspecte ale testului, putem rezuma în acest moment 
elementele de bază ale definiției testelor psihologice aşa cum reies din analiza celor enumerate. 


Definirea elementelor Explicații Argumentare 
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Testele psihologice sunt 
proceduri sistematice, 
obiective 


Sunt caracterizate prin 
planificare, uniformitate, 
standardizare, şi 
minutiozitate. 


Testele trebuie sa fie, in mod 
demonstrabil, obiective şi 


corecte pentru a fi folositoare. 


Testele psihologice sunt 
eşantioane de comportament. 


Sunt mici părţi dintr-un întreg 
mult mai mare. 


Eşantionarea 
comportamentului este 
eficientă deoarece timpul 
disponibil este, în mod 
obişnuit, limitat. 


Comportamentele selectate 
pentru teste sunt relevante 
pentru funcţionarea cognitivă 
sau afectivă a persoanei, sau 
pentru ambele. 


Eşantioanele de 
comportament sunt selectate 
datorită semnificației lor 
empirice şi psihologice. 


Testele, spre deosebire de 
jocurile mentale, există 
pentru a fi utile; sunt 
instrumente. Diagnosticul sau 
puterea predictivă depinde 
de relevanta eşantionului de 
comportament selectat. 


Rezultatele la teste sunt 
evaluate şi 
scorate(transformate în 
scoruri- cantități). 


Un anume sistem, de 
categorii sau numere, este 
aplicat rezultatelor la teste, în 
concordanță cu reguli 
prestabilite. 


Nu trebuie să existe nici o 
îndoială, nici o discuție, 
legată de ceea ce reprezintă 
rezultatele la teste. 


Pentru a evalua rezultatele 
testului (a afla semnificația 
lor) este necesar să avem 
standarde bazate pe date 
empirice. 


Trebuie să existe un mod de a 
aplica rezultatelor o măsură 
comună (un etalon) sau un 
criteriu comun. 


Numai standardele utilizate 
pentru evaluarea rezultatelor 
testului oferă singura 
semnificație pe care acestea o 
pot avea. 


Tabel. Elemente de bază ale definiției testelor psihologice 


Alte noțiuni care au legătură cu testul psihologic 


Scoruri- valori numerice care reprezintă evaluarea răspunsurilor la un test, după reguli precizate 
Item- un element al testului psihologic constituit dintr-o situație stimul care solicită un răspuns ce 
poate fi evaluat separat de restul testului 
Scală- în psihometrie sensul cel mai utilizat este -un set de itemi care se referă la acelaşi aspect- un 
atribut psihic pe care testul îl măsoară sau un comportament pe care testul îl prezice, spre exemplu 
scala de Depresivitate a Chestionarului de personalitate FPI- Freiburg; 
- uneori noțiunea de scală se referă la un întreg test, constituit din mai multe părți- spre exemplu 
Scala de inteligență Stanford-Binet; 
- mai multe subteste care se referă la acelaşi aspect- spre exemplu- scalele verbale ale testului de 
inteligență Wechsler; 
- un instrument separat destinat să măsoare un singur aspect, spre exemplu scala de Locus of 
control- Intern- Extern a lui Julian B. Rotter; 
- sistemul numeric utilizat pentru a culege răspunsurile subiectilor la un test, spre exemplu o 
scală de la 1 la 5, unde 1 semnifică- Acord puternic şi 5 semnifică- Dezacord puternic 
Baterie de teste- este un alt termen des utilizat în titlurile testelor sau în lucrările despre 
psihodiagnoză. O baterie de teste este un grup de câteva teste, sau subteste, care sunt administrate în 
acelaşi timp unei persoane sau unui grup de persoane. Când mai multe teste fac parte din acelaşi 
pachet comercializat de către autor pentru a fi utilizate într-un scop specific, de obicei cuvântul baterie 
apare în titlu şi întreg grupul de teste este considerat ca un singur instrument, în ansamblu. 
Termenul de baterie de teste mai este utilizat pentru a desemna orice selecție specifică de teste făcută 
de către un psiholog pentru a fi utilizate cu un client, pentru a da un răspuns la o problemă specifică, 
de obicei în scopuri diagnostice, sau de selecție. 
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CLASIFICĂRI ALE TESTELOR 
Având în vedere că există extrem de multe teste, problema clasificării lor şi, legat de aceasta, a 
criteriilor de clasificare devine importantă. Desigur, mai multi autori au încercat să realizeze 
clasificări, însă noi ne vom referi la patru autori români: Horia Pitariu, Ursula Schiopu, Nicolae 


Mitrofan şi Monica Albu. Pentru uşurinţa vizualizării vom reda clasificările sub formă de tabel. 


Clasificarea testelor după Horia Pitariu (1993) 


Criterii Subcriterii Categorii de teste 
e teste verbale- orale sau scrise 
e teste nonverbale- manipulare de 
e După sarcină aparate şi piese sau cu ajutorul 
calculatorului 
Conţinutul eee A lonnan E 
‘enti teste intelective- aptitudini, 
cunostinte,situationale,probe de 
e După modul de lucru 
procesare e teste nonintelective 
(chestionare/inventare de 
personalitate) 
7 cule IEEE ce ; teste individuale 
eficacitatea examenului ; 
à e teste de grup sau colective 
psihologic 
Administrarea e Exigente legate de ke ace a mae 
testului timpul de examinare. x Ele L z eG anil, Nene of li: cH 
limită de timp, cu timp nelimitat 
e Standardizare e Teste standardizate 
Teste nestandardizate 
e Obiectivă Teste obiective- performanța se apreciază 
Cotarea după o procedură fixă, impersonală 
testului POES Teste proiective- prezintă în cotare o doză 
e Subiectivă TE a 
mare de subiectivism 
Clasificarea testelor după Ursula Şchiopu(2003) 
Criterii Categorii Exemple 
De inteligență: 
e cunostinte(pedagogice) e Generală 
e inteligență; e Tehnică 
e aptitudini; e Abstractă 
e senzorio-motorii; e Socială 
Sarcinile e atenție e Emotionala 
psihodiagnozei,, e memorie e kinestezică. 
scopul e personalitate testele de atenție 
e sociabilitate e concentrarea 
e creativitate e stabilitatea 
e temperament e mobilitatea 
e interese e distributivitatea 
Memoria cifrelor, a 
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figurilor; 
Memoria topografică 
De aptitudini speciale 


e tehnice 

e numerice 

e matematice 
e artistice 

e verbale 

e pedagogice 


e organizatorice 


Diferențele 
semnificative de 
strategie incluse în 
structura de 
ansamblu a bateriei 


Niciun fel de legătură între testele unei 
baterii 


Măsoară în mod 
independent caracteristici 
psihice total diferite 


Intre teste poate să existe o corelație 
pozitivă, cu valoarea coeficientului de 
corelație ce tinde către valoarea 1 


când măsoară aceeaşi 
însuşire psihică. 


Mai multe teste pot fi saturate diferit în 


ceea ce priveşte fiecare dintre aceşti factori 


comuni 


Tipul de material 
administrat în teste 
şi caracteristicile 
acestuia 


Testele ,,creion-hartie”’ 


Orice test la care răspunsul 
se dă pe o foaie de hârtie 


Testele- aparate 


pompa Schultz, 
strungul Lahy etc. 


Testele ce folosesc diferite materiale 


cuburile Kohs, asamblarea 
de imagini etc. 


Testele verbale 


Ex. NEO PIR 


Testele nonverbale 


Ex. NPQ 


Un singur subiect, ex. 


Diferențe în ceea ce | Individuale Stanford —Binet, Wechsler, 

priveste forma de Szondi 

administrare a Un grup de subiecti 

testelor Colective simultan(pot fi aplicate şi 
individual) 

Cu răspuns la alegere BED NUI A Eco 

scala de la 1 la 5 etc. 

Caracteristicile Mai ales de inteligenţă şi 


tipurilor de 
răspunsuri solicitate 


Cu un singur răspuns bun 


aptitudini 


Cu răspuns liber 


Mai ales testele proiective, 
ex.Asociativ- verbal, 
Rorschach, TAT 


Tipurile de 
răspunsuri primite 


Sintetice, rezultă un coeficient global, sau 
un tip 


Ex. IQ, EQ etc., tipul 
MBTI 


Analitice, rezultă un profil 


Mai ales inventarele de 
personalitate 


Un alt autor român, Nicolae Mitrofan(2007) observă, legat de aceste clasificări faptul că: 
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„În niciuna nu sunt luate în atenţie testele care sunt oferite nu neapărat psihologilor specialişti, ci 
nespecialiştilor.”, şi mai propune încă un criteriu şi anume gradul de standardizare, diferentiind trei 
categorii de teste: 

1. teste standardizate, cele care pot fi aplicate numai de către psihologi; 

2. teste semistandardizate, cele care sunt destinate altor categorii de beneficiari, cum ar fi: 
cadrele didactice, părinţii, personal medical, asistenţi sociali etc. 

3. teste nestandardizate, cele care se folosesc mai mult pentru ocuparea timpului liber . 


Monica Albu(1998) deşi aplică aceleaşi criterii ca şi Horia Pitariu adaugă câteva categorii diferite. 
Spre exemplu în ceea ce priveşte testele de personalitate(nonintelective), apar trei categorii: 
e Chestionare de personalitate 
e Tehnici proiective 
e Teste obiective de personalitate 
După modul în care variază proba de la o administrare la alta: 
e Cu continut fix- majoritatea 
e Cu conţinut variabil 
o cele idiografice 
o cele adaptative — de aptitudini sau cunoştinţe, şi cele de personalitate 
După modul de interpretare a scorurilor la teste sunt: 
e Teste normative 
e Teste centrate pe criteriu 
e Teste idiografice 
e Teste ipsative 


O să aprofundăm discuţia pentru anumite tipuri de teste, mai frecvent utilizate: 
e  Chestionarele de personalitate 
e Testele proiective 
e Testele obiective de personalitate 
e Clasificarea în funcţie de modul în care variază proba de la o administrare la alta 
e Clasificarea în funcție de modul de cotare a testului şi de interpretare a scorurilor 


4.3. CALITĂŢILE GENERALE ALE TESTULUI ŞI „ECHIPAMENTUL TESTULUI 
PSIHOLOGIC” 


Pentru a decide alegerea unui anumit test pentru o situație concretă este necesar să se evalueze 
adecvarea lui la obiectivele examenului psihologic, adică în ce măsură testul este relevant pentru 
diagnoza sau predicția comportamentului care constituie scopul specific al examenului respectiv. 
Există o evaluare practică a testului şi o evaluare tehnică. Privind factorii ce determină valoarea 
practică a testului putem enumera: 

e Utilitatea 

e Acceptabilitatea 

e Sensibilitatea 
Caracterul direct 
Nonreactivitatea 
Caracterul compatibil 
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Utilitatea se referă la avantajul practic pe care îl putem obţine din utilizarea unui anume 
instrument(Gottman, Leiblum, 1974, apud Minulescu, M., 2003), măsura în care instrumentul ajută la 
rezolvarea unei probleme practice- intervenţie, feedback privind eficienţa intervenţiei, selecție, 
promovare etc. Alte aspecte ale utilității sunt: scopul testului, lungimea, uşurinţa în scorare, uşurinţa în 
intrepretare. 

Acceptabilitatea se referă la necesitatea ca instrumentul să poată avea sens pentru persoana- adică să 
fie potrivit la condiţia intelectuală şi emoțională a persoanei, să reflecte exact problema persoanei şi să 
fie privit pozitiv de subiect (să nu fie prea intruziv sau ofensiv). 

Sensibilitatea se referă la capacitatea testului de a sesiza schimbările în timp. Mai ales în consiliere 
sau terapie este nevoie de un instrument capabil să sesizeze progresul persoanei. 

Caracterul direct se referă la capacitatea testului de a reflecta comportamenztul real, gândurile sau 
sentimentele reale ale persoanei. Măsurile directe sunt considerate semne ale problemei, în timp ce 
măsurile indirecte sunt considerate simboluri ale problemei, ceea ce necesită inferente, adică 
sunt considerate indirecte. Toate instrumentele se situează pe o dimensiune ce uneşte aceste două 
extreme. Atunci când se pune accent pe fidelitatea datelor caracterul direct al testului este decisiv. 
Nonreactivitatea se referă la calitatea testului de a nu provoca o anumită reacție subiectului, 
influențând astfel răspunsul. Această calitate are legătură şi cu caracterul nonintruziv al conţinutului, şi 
cu dezirabilitatea acestora. Sunt indicate instrumentele care nu determină reactivitatea subiectului. 
Adecvarea generală a instrumentului este criteriul final, adică măsura în care acesta este compatibil 
pentru o evaluare fără complicaţii; instrumentele prea lungi sau prea complicate ca scorare pot fi utile 
ca informaţie dar nepractice datorită consumului de timp. Adecvarea se referă desigur şi la aspecte mai 
tehnice: fidelitatea şi validitatea informaţiei, obiectivitatea datelor pe care se poate întemeia o decizie. 


Privind valoarea tehnică a testului mai putem cita pe Lawrence M. Rudner(1994) “Questions To Ask 
When Evaluating Tests” ( Practical Assessment, Research & Evaluation), care formulează un ghid al 
evaluării unui test care cuprinde următoarele întrebări, pe domenii de interes pentru cel care face 
selecţia: 
1. Care este utilizarea ce se intenţionează pentru test? Ce interpretări simte autorul testului că sunt 
2. Pentru ce anume este destinat testul? Care este baza pentru a considera că testul se aplică 
subiectului/subiectilor dumneavoastră? 


Există eşantioane potrivite pentru validare şi normare? 


1. Cum au fost alese eşantioanele utilizate în testarea pilot, în validare şi normare? Cum este 
acest eşantion relationat cu populaţia dumneavoastră? Sunt ratele de participare potrivite? 

2. A fost eşantionul destul de mare pentru a dezvolta estimări stabile cu fluctuații minime 
datorate erorilor de eşantionare? Există afirmaţii despre subgrupuri, sunt de ajuns de multi 
subiecţi în fiecare subgrup? 

3. Dificultăţile de măsurare ale testului şi ale criteriului(dacă sunt) furnizează o bază adecvată 
pentru validarea şi normarea instrumentului? Sunt suficiente variaţii în scorurile testelor? 


Despre dovezile fidelității 
Testul este suficient de fidel pentru a permite estimări stabile ale nivelurilor de abilitate ale 
indivizilor în grupul ţintă. 
Interesul cel mai mare îl prezintă consistenţa internă datorată erorilor de eşantionare a conţinutului, 
de obicei sursa cea mai importantă de eroare. 
1. Cum au fost calculate estimările fidelității? Au fost utilizate metode statistice 
potrivite?(exemplu- fidelitatea half-split nu trebuie calculată în testele de viteză) 
2. Care sunt dovezile de fidelitate pentru grupuri de subiecți diferiţi şi cum au fost calculate? 
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3. Este fidelitatea suficient de înaltă pentru a garanta utilizarea testului ca bază pentru decizia 
asupra indivizilor? 

4. În ce grad grupurile utilizate pentru calculul fidelității sunt similare cu grupurile pe care va fi 
utilizat testul? 


Despre dovezile validității relative la criteriu 
Testul prezice adecvat performanța în domeniul în care va fi folosit. 


1. Ce măsură a criteriului a fost utilizată pentru a evalua validitatea? Care este raţiunea pentru 
care a fost aleasă această măsură? 

2. Este adecvată distribuţia scorurilor la măsurătorile criteriului? 

3. Care este acurateţea predictivă globală a testului? Cat de precise sunt predicțiile pentru 
indivizii ale căror scoruri sunt apropiate de scorul limită ? 


Despre dovezile validității relative la conţinut 
Gradul în care itemii testului sunt reprezentativi pentru abilităţile în domeniul de interes. 
1. Există o imagine clară a universului abilităţilor reprezentate de test? Ce tip de cercetare a fost 
făcută pentru a determina conţinutul dorit al testului sau pentru evaluarea sa? 
2. Care este compunerea echipelor de experți utiliuzati în validarea conţinutului? Cum au fost 


judecatile obtinute/ solicitate? 
3. Cat de similar este acest conţinut cu cel pe care doriţi să-l testati? 


Despre dovezile validitatii relative la construct 
Testul măsoară constructul psihologic “corect” (dorit) 
1. Este cadrul conceptual pentru fiecare construct testat clar si bine fundamentat? Care este baza 
pe care s-a concluzionat ca scopul testului este relationat cu acest construct? 


2. Cadrul conceptual furnizeaza o baza pentru ipoteze testabile care privesc constructul? Sunt 
aceste ipoteze sprijinite de datele empirice? 


Despre administrarea testului 

Există instrucțiuni clare, potrivite şi detaliate care privesc procedurile de administrare a testului. 
Toate specificaţiile de administrare a testului, inclusiv instructajul pentru subiecţi, liitele de timp, 
utilizarea unor materiale de referinţă şi calculatoare, iluminare, echipamente, aşezare, monitorizare, 


cerinţe legate de camera de testare, secvențele de testare, ora potrivită etc. trebuie descrise în detaliu. 


1. Persoana care administrează testul înţelege cu precizie ce anume se aşteaptă de la ea? 
2. Procedurile de administrare a testului reproduc condiţiile în care testul a fost validat şi normat? 
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Despre raportul în urma testului 


Metodele utilizate pentru a raporta rezultatele testului, incluzând scorurile scalate, rezultatele la 
subteste şi rezultatele combinate ale testului, sunt descrise în detaliu împreună cu raţiunea fiecărei 
metode(testul trebuie să fie util pentru a lua decizii). 


1. Cum sunt raportate rezultatele testului?Sunt scalele utilizate pentru raportare de ajutor pentru o 
utilizare potrivită a testului? 
2. Ce materiale şi resurse sunt disponibile pentru ajutor în interpretarea testului? 


Bias- uri ale testului sau itemilor 


Testul nu este afectat sau ofensiv privitor la rasă, sex, limba nativă, originea etnică, regiunea 
geografică sau alti factori. 


Este de aşteptat ca dezvoltatorii de teste să fie atenţi la caracteristicile demografice ale subiecților 
testării. 


1. Au fost itemii analizati statistic pentru a descoperi eventuale bias-uri? Ce metode s-au folosit? 
Cum au fost itemii selectaţi pentru a fi incluşi în versiunea finală a testului? 

2. A fost analizat validitatea diferențială testului între grupuri? Cum a fost desfăşurată această 
analiză? 

3. A fost determinată influenţa nivelului de cunoaştere a limbii asupra rezultatelor testului? Poate 
fi folosit testul cu vorbitori non-nativi ai limbi respective? 


După Susana Urbina(2004) există anumite situaţii cînd nu este recomandabilă utilizarea testelor. Zece 
motive pentru a nu utiliza un test psihologic 
Sunt multe motive şi multe situaţii în care utilizarea unui test psihologic nu este recomandabila; lista 
care urmează prezintă pe cele mai relevante dintre ele. Cu câteva excepții, testele psihologice nu ar 
trebui utilizate de fiecare dată când una dintre circumstanţele următoare apar: 

1. Scopul testării este necunoscut sau neclar pentru utilizator. 

2. Utilizatorul nu este complet familiarizat cu toată documentaţia testului şi pregătit practic în 

procedurile legate de test. 
3. Utilizatorul nu cunoaşte unde vor ajunge rezultatele testului, sau cum vor fi utilizate, sau nu 
poate proteja folosirea lor. 

4. Informaţia care poate fi obţinută prin testare este deja valabilă, sau poate fi obținută mai 
eficient prin intermediul altor surse. 
Subiectul testării nu este doritor sau capabil să coopereze pentru testare. 
Subiectul testării poate experimenta consecinţe neplăcute datorită procesului de testare în sine. 
Condiţiile de testare sunt inadecvate. 
Materialele testului şi formatul acestuia sunt nepotrivite pentru vârsta, sexul, backgroundul 
cultural sau lingvistic, disabilitatilor, sau oricăror alte condiţii care pot invalida informațiile 
oferite de test. 
9. Normele testului sunt depăşite ca timp, inadecvate, sau inaplicabiel pentru subiect. 
10. Documentaţia asupra fidelității şi validității scorurilor testului este inadecvată. 


Go: le SA 


Manualul testului 
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Manualul testului trebuie să cuprindă, conform celor mai cunoscute standarde similare cu ale noastre: 


1. 


Informatia generala despre: 


Titlul, editia, formele 

Autorii 

Data publicării, manualele la dispoziție, materialele suplimentare 
Timpul de administrare 

Costul pentru caiet şi 50 foi de răspuns 


Descriere pe scurt a scopului/ naturii testului 


e Tipul general al testului- individual, de grup, de performanţă, baterie de aptitudini, 
inventar de interese etc. 

e Natura conţinutului: numeric, verbal, spaţial, psiho-motor 
Subteste în cadrul testului, scale, scoruri separate pentru scale 
Tipuri de itemi 


3. Evaluarea practică 


Trăsături sau aspecte calitative ale materialelor testului, referitoare la: 

o  Uşurinţa utilizării testului 

o  Atractivitate atestului 

o Adecvarea fata de subiecţii testati 
Aspecte privind modul de administrare- facilităţi de utilizare a computerului în administrare şi 
prelucrare etc. 
Proceduri de cotare- tipul de grilă, descrierea modului de cotare 
Calificări care se cer pentru administrarea testului: nivelul de formare cerut(C.P.I. cere un 
certificat pentru intrepretarea sa; testele de personalitate în general necesită formare); 
Validitatea de faţadă sau aspectul de fatada- prezentarea testului pentru subiecţi; 


4. Evaluări tehnice 


A 


Normele- etaloanele testului- tipuri de norme- percentilele, scorurile standard 
o Egşantionul de normare- natura, mărimea, reprezentativitatea, proceduri pentru obținerea 
eşantionului, criteriile pe baza cărora s-au stabilit subiecții 
o Grupele de normare- vîrsta, sexul, educația, ocupația, regiunea din care provin subiecții 
Fidelitatea- marja preciziei de măsurare- priveşte tipurile de fidelitate şi procedurile: 
o Tipuri de fidelitate- prin retestare, prin forme paralele, prin înjumătățire testului, Kuder- 
Richardson, prin coeficientul Alpha- Cronbach 
o Alte informații procedurale- mărimea şi natura eşantionalor folosite pentru calculul 
fidelității, echivalentele diferitelor forme de fidelitate, stabilitatea pe termen lung, 
eroarea standard a măsurării 
Validitatea- tipuri adecvate de proceduri de validare- de conținut, de criteriu, predictivă sau 
concurentă, de construct 
o Proceduri specifice pentru măsurarea validității şi rezultatele lor, exprimate sub forma 
dovezilor validității 
o Mărimea şi natura eşantioanelor folosite 


Revizii ale testului- direcţii, studii, date de cercetare 
Evaluarea rezumativă a testului care priveşte: 
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e Aspectele pozitive majore sau slăbiciuni majore ale testului 

e Testul ca instrument de diagnoză: dacă spre exemplu este inatacabil când se fac cercetări 
judiciare în legătură cu o diagnoză, deşi unii subiecţi atacă deciziile în urma testelor- se 
oferă credibilitate maximă testului 


4.4. PROCEDURA DE SELECȚIE A UNUI TEST 


Parafrazâd un personaj celebru al lui Shakespeare, Susana Urbina(2004) afirmă “To Use or Not to Use 
(Tests), That Is the (First) Question”. Admitand un răspuns afirmativ atunci mai rămâne o singură 
problemă, cum anume o facem. Mihaela Minulescu (2003) oferă un posibil ghid de decizie: 


Cum selectăm un test? 


1. Cadrul de referinţă care poate ghida alegerea unui instrument de măsură trebuie să răspundă la 
următorul set de întrebări(arbore decizional): 


Ce tip de evaluări sau decizii trebuie realizate? 

Ce tip de informatie este necesară pentru a realiza evaluări şi decizii optime? 

De ce tip de informaţie dispunem deja? 

Cum şi de unde poate fi obținut restul de informaţie? 

Ce metode şi/ sau instrumente avem la dispoziţie pentru a obține această informatie? 
Există şi/sau avem testele respective sau trebuie create? 

Cum trebuie evaluate testele sau instrumentele respective pentru a fi adecvate cerinţelor 
specifice? 

e Ce alte criterii trebuie să utilizăm în alegerea lor? 


2. Evaluarea testului sau instrumentului presupune compararea acestuia cu o serie de cerinţe practice şi 
tehnice, dintre care esenţiale sunt: fidelitatea- precizia măsurării, dovezi ale validității- capacitatea 
testului de a prezice performanța sau de a evidenția un diagnostic, interpretabilitatea şi 
predictibilitatea, toate acestea judecate în contextul concret al aplicării — scopul testării, populaţia pe 
care se aplică, condiţiile de testare. 


Un posibil checklist pentru instrument poate cuprinde: 


Natura constructului 

Numărul de persoane ce trebuie testate 
Caracteristici ale examinatorului 
Caracteristici ale celui examinat 
Constrângeri practice 


3. Criterii finale pentru decizia privind alegerea testului: 


e Este testul destinat să măsoare comportamentul avut în vedere? Manualul său descrie scopurile 
testului; descrie adecvat comportamentele pe care le măsoară? 
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e Itemii testului pot măsura trăsăturile, obiectivele sau comportamentele ce trebuie evaluate? 

e Este disponibilă informaţia privind diferitele aspecte referitoare la validitatea testului? Trebuie 
să determinăm dacă testul este valid pentru scopul specific, avut în vedere în prezent. În 
măsura în care testul cuprinde un număr limitat de itemi care să reprezinte direct obiectivele 
sau comportamentele de măsurat este important să stabilim că aceştia sunt într-un înalt grad 
reprezentativi pentru condiţia reală a celui testat. În aceeaşi măsură trebuie să verificăm, 
pornind de la faptul că testele folosesc constructe ipotetice care au fost definite operaţional de 
autorii lor, dacă există dovezi privind validitatea de construct a testului; în ce măsură 
rezultatele testului pot descrie competenţe într-o anumită aptitudine sau domeniu de conţinut. 

e Este testul demn de încredere- fidel? Stabilitatea sau consistenţa testului în timp, a itemilor sai; 
cât de precis pot fi interpretate rezultatele? Dacă testele trebuie interpretate în raport cu 
persoane, este necesară şi utilă informaţia privind erorile standard de masurare(un test cu SEM- 
eroarea standard a măsurării, nu este adecvat pentru diagnoza individuală şi nici în decizia 
privind plasamentul sau predicții). 

e Sunt furnizate informaţii suficiente pentru psiholog pentru a putea interpreta rezultatele? 
Etaloanele puse la dispoziție sunt adecvate, persoana testată face parte din grupul de referinţă 
al etalonului disponibil? Există informaţie despre grupul de normare? Sunt specificate tehnici 
pentru a interpreta testul şi înţelesul diferitelor scale? 

e Furnizeaza testul un feedback de interpretare pentru cel examinat? Putem furniza informaţii 
celui/celor testati legate de felul cum au performat la test? Poate fi înţeleasă informaţia? 

e Este adecvat testul pentru cel examinat? Se iau în considerare nivelul de informatie şi chiar de 
citire propriu-zisă pentru itemii testului. Dacă este prea dificil, persoana examinată poate avea 
dificultăţi de înţelegere a vocabularului, expresiilor sau exemplelor pe baza cărora răspunde. 
Intervin şi probleme mai concrete legate de mărimea literei, forma de prezentare şi maniera de 
a răspunde la test. Este adecvat testul vârstei sau condiţiei psihologice a celui testat? 

e ste testul neinfluentat de factori precum prejudecățile sau deprinderile? Scopul este să avem 
itemi care sunt relevanti şi pot fi intelesi în sensul lor propriu, nu figurat. 

e Este testul, din perspectiva aspectelor practice, util? Problemele practice: costul, materiale 
suplimentare, timp de administrare, de interpretare etc. pot fi uneori decisive în selecţia unei 
probe pentru un program de testare. 
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5. MASURAREA IN PSIHODIAGNOZA 


-SINTEZA- 
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5.1.Măsurarea în psihologie şi tipuri de scale de măsurare 
5.2.Calităţi metrologice ale testelor psihologice 
5.3.Concepte-cheie implicate în metrologie 


5.1. MĂSURAREA ÎN PSIHOLOGIE ŞI TIPURI DE SCALE DE MĂSURARE 


Măsurarea poate fi definită ca un proces sistematic de atribuire a unui număr unei anume variabile, 
respectiv „cuantificarea” aspectului psihologic. Variabila psihologică poate fi comportamentul clientului, 
sentimentele, atitudinile, scopurile sau rezultatul unui tratament, concepte teoretice ca estimarea de sine sau 
imaginea de sine. Numărul atribuit reprezintă caracteristica variabilei respective. Există mai multe 
definiţii ale măsurării(Albu, M., 1998). 

Majoritatea acestora sunt de forma următoare: 
"măsurarea constă în atribuirea de x lui y în conformitate cu z". 
În funcţie de autor: 


xX reprezintă "numere", "valori", "scoruri" sau "simboluri abstracte"; 

y este înlocuit cu "obiecte", "evenimente", "lucruri", "situații", "indivizi", 
"comportamente", "observații", "atribute", "proprietăți" sau "răspunsuri"; 

Z primeşte semnificația de "regulă specifică" sau "regulă de reprezentare"(Michell, 1997). 


Prin măsurare a unei caracteristici la o mulțime de obiecte înțelegem atribuirea de numere obiectelor 
studiate, conform unei reguli bine precizate, prin care se urmăreşte ca anumite relații existente între 
obiecte, în privința caracteristicii respective, să existe şi între numerele atribuite lor. Mai precis, dacă 
în mulțimea obiectelor este definită o anumită relație (de exemplu, o relaţie de ordine), atunci trebuie 
să existe o relaţie similară în mulțimea măsurilor elementelor, iar dacă două obiecte sunt în relaţia 
considerată atunci măsurile lor trebuie să fie în relația similară ei. De pildă, dacă din punctul de vedere 
al caracteristici cercetate un obiect X este superior unui obiect Y, atunci măsura obiectului X trebuie 
să fie mai mare decât măsura obiectului Y. Înseamnă, deci, că măsurarea stabileşte un izomorfism între 
mulţimea obiectelor şi mulțimea măsurilor obiectelor. în asemenea condiţii se pot efectua diverse 
operaţii asupra măsurilor obiectelor, iar concluziile desprinse se extind asupra obiectelor. 

Din punct de vedere matematic, măsurarea este o funcţie care ataşează fiecărui element din 
mulțimea de obiecte (mulțimea de definiţie a funcţiei), conform unor anumite reguli, un număr şi 
numai unul (din mulțimea în care funcţia ia valori), numit "măsura elementului". 

Fiecare sistem de reguli impus defineşte câte un tip de măsurare sau câte un tip de scală. În 
general sunt utilizate patru tipuri de scale de măsură. În ordinea crescătoare a preciziei lor, acestea 
sunt: 

escala nominală- precizie minimă, prelucrări statistice minime, concluzii puţine; 

escala ordinală- precizie mai mare, ordonare; 

escala de interval- precizie suficientă, majoritatea prelucrărilor statistice, concluzii; 

escala de raport- precizie maximă, prelucrări statistice complexe, concluzii numeroase. 
Regulile impuse pentru definirea unui tip de scală le includ, totdeauna, pe cele impuse pentru definirea 
scalelor aflate pe un nivel inferior. De exemplu, dacă s-a putut defini o scală de interval, atunci s-ar fi 
putut defini şi o scală ordinală sau una nominală. 
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RETINETI 


1. Alegerea unui anumit nivel de măsurare pentru o mulţime de obiecte este dependentă 
de numărul şi tipul relaţiilor existente între obiecte şi care prezintă interes pentru 
cercetător. Evident, aceste relaţii se referă la caracteristica analizată. 


2. Prelucrările statistice care pot fi efectuate asupra măsurilor obiectelor pentru a 
cunoaşte mai bine obiectele sunt dependente de tipul de scală utilizat. Cu cât scala de 
măsură este mai precisă, cu atât prelucrările statistice permise sunt mai complexe şi 
conduc la concluzii mai numeroase. 


Măsurarea pe o scală nominală(categorială): 

Poate fi utilizată de fiecare dată când caracteristica studiată permite împărțirea elementelor mulțimii de 
obiecte în clase disjuncte două câte două. În fiecare clasă sunt grupate toate obiectele care pot fi considerate 
echivalente în privinţa acelei caracteristici. 

Exemplu: categoria socio-profesionala, sex(1 poate semnifica- sexul masculin, 2- sexul feminin, sau M — 
masculin şi F- feminin), naţionalitate, etc. 

Regula impusă la măsurarea nominală este ca toate elementele dintr-o aceeaşi clasă de echivalență să aibă 
aceeaşi măsură, şi reciproc, o valoare a măsurii să apară numai la elemente echivalente între ele. O 
posibilitate de definire a unei scale nominale constă în atribuirea de numere distincte(alese arbitrar) claselor 
de obiecte, toate obiecte având astfel aceeaşi măsură- cea ataşată clasei. Măsura unui element este de fapt o 
„etichetă” atribuită elementului, pentru denumirea, identificarea sau clasificarea acestuia. Poate fi exprimată 
numeric sau prin cuvinte, deci nu se pot face nici un fel calcule matematice cu măsurile nominale. Prin 
măsura nominală se poate obţine o singură informatie asupra elementelor mulțimii de obiecte- două obiecte 
pot sau nu să facă parte din aceeaşi clasă. De aceea este bazală. 


Măsurarea pe o scală ordinală: 

Impune ca între elementele mulţimii de obiecte să existe o ordine, dar cu permisiunea ca mai multe obiecte să 
ocupe acelaşi loc. Spre exemplu persoanele dintr-un compartiment de muncă al unei firme pot fi ordonate în 
funcţie de randamentul lor, de la cel mai eficient la cel mai putin eficient. În acest fel acceptăm convenţia că 
un element aflat mai sus în clasament este „superior” unui alt element care se află mai jos în acelaşi 
clasament (este mai mare decât, este mai bun decât, este preferatul lui), dar nu avem nici o informaţie despre 
mărimea distanţei între cele două elemente. Dacă două elemente ocupă acelaşi loc în şirul ordonat, vom 
spune că sunt echivalente. 

Reguli: este valabilă regula de la măsurarea nominală şi în plus dacă un element este superior altui element, 
atunci şi măsura sa va fi superioară(dar nu ştim cu cât). 

Exemplu: calificativele pe care jucătorii unei echipe de fotbal le primesc dupa un meci- de la foarte bun, bun, 
mediu, slab, foarte slab- indică o scală ordinală; severitatea depresiei descrisă în DSM IV R, şi în general 
severitatea simptomelor în clinică- indică o scală ordinală. 

Scala este utilizată în mod curent dacă este cerută autoevaluarea- unei preferinţe, atitudini, comportament- ce 
pot fi descrise prin termeni de genul-,,foarte puţin”, „puţin”, „mediu”, „mult”, „foarte mult”. Nu se pot face 
operaţii matematice altele decât ordonarea- poziţia relativă, deoarece nu putem spune nimic despre distanța 
dintre două elemente. 


Măsurarea pe o scală de interval: 
Poate fi utilizată atunci când există categorii diferite, un clasament şi în plus putem aprecia „distanţa” care 
desparte oricare două elemente în privinţa caracteristici studiate. 
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Reguli valabile: sunt valabile regulile de la celelalte scale- categorii diferite, ordonarea, şi în plus putem 
aprecia distanţa dintre două elemente, care este egală între oricare două elemente consecutive- echidistanta. 
Ceea ce lipseşte este faptul că nu avem un punct de plecare egal cu 0, adică absenţa totală a caracteristici 
respective. Calculele matematice ce pot fi făcute sunt- adunare, înmulțire, împărțire, scădere. Lipsind 
valoarea lui zero absolut nu putem cu adevărat să cunoaştem semnificaţia multiplicării sau împărțirii 
scorurilor, deoarece un scor de 25 la un chestionar s-ar putea să nu reflecte jumătate din scorul 50. Putem 
spune că scorul 50 este mai mare cu 25 decât 25, dar nu putem afirma că este de două ori mai bun. 
Exemplu: scala de temperatură- are intervale egale- echidistante, are şi valoarea 0, dar valoarea 0 nu 
înseamnă absenţa temperaturii. Diferenţa între 10 grade şi 15 grade este aceeaşi ca între 30 de grade şi 35 de 
grade, dar nu putem afirma nimic despre cât de mare este 15 grade în comparaţie cu 10 grade. 

Alt exemplu- calendarele. Există un punct zero dar el este fixat arbitrar. 

Normele testelor se bazează scala de interval. Putem compara mai multe caracteristici ale unui obiect 
între ele, măsurate pe o scală de interval, chiar dacă fiecare dintre măsurători furnizează valori în alt 
interval. Pentru aceasta se calculează scorurile standard, prin transformarea scorurilor brute. 


Măsurarea pe o scală de raport: 

Poate fi utilizată când avem categorii, ordonare, intervale egale şi în plus se poate aprecia obiectiv când un 
element este lipsit de caracteristica cercetată. Atunci când caracteristica măsurată reprezintă spaţiu (lungime, 
suprafaţă, volum), masă, sau timp trecut de la un eveniment fixat drept origine(durata de viaţă, durata de la un 
anumit eveniment precizat şi pâna la apariția altui eveniment precizat, timpul de reacţie etc.) se poate stabili 
în mod obiectiv ce însemnă absenţa caracteristicii(adică punctul zero absolut). Pentru asemenea variabile se 
pot face măsurători de raport. În acest caz se poate deduce decâte ori o măsură este mai mare sau mai mică 
decât o altă măsură. 

Exemplu: înălțimea de 1,80 m este de două ori mai mare decât 90 cm, deci persoana este de două ori mai 
înaltă; un autovehicul care se deplasează cu 100 km la oră merge de două ori mai repede decât una care are 
50 km la oră; vârsta de 40 de ani este de două ori mai mare decât cea de 20 de ani. 

Observaţie: dacă valorile metrice se transformă spre exemplu în trei grupe: sub 20 de ani, între 20 de ani şi 40 
de ani, şi peste 40 de ani- atunci scala de raport se transformă într-o scală cu precizie mai mică- o scală 
ordinală. Dacă se transformă în cote standard valorile unei scale de raport- atunci noua scală va fi de interval. 
Măsurile de tip proporţie sunt relativ rare în domeniul ştiinţelor comportamentale. 


Scalele diferă deci între ele prin patru caracteristici: exclusivitatea, ordonarea, echivalenta, caracterul 
absolut. 

Scalele de interval şi de proporţie se mai numesc şi metrice(variabilele obţinute se mai numesc scoruri), iar 
cele nominale şi ordinale nonmetrice. 

Alegerea unui tip de scală pentru măsurarea unei variabile trebuie să aibă în vedere, în primul rând, 
tipul de prelucrări statistice care ar trebui efectuate asupra variabilei. Dacă relaţiile cunoscute între elementele 
mulţimii de obiecte nu permit măsurarea variabilei pe scala care ar fi necesară calculelor statistice se va 
realiza o măsurare pe o scală inferioară ca precizie dar cât mai apropiată. 

Măsurarea cantitativă în psihologie include trei tipuri de statistici, şi anume: 

1. statistici descriptive; 

2. statistici inferentiale; 

3. statistici multivariate. 
1. Statisticile descriptive: grafice, modul de prezentare, de manipulare simplă a datelor (media, 
mediana, frecvenţa). 
2. Statisticile inferentiale: permit formularea unor concluzii referitoare la unul sau mai multi indivizi, 
bazându-se pe datele de eşantion, de lot. de grup de indivizi. Acest tip de statistici se referă la corelaţii, 
varianta comportamentală, capacitatea de a judeca diferenţele dintre indivizi sau dintre grupurile de 
indivizi. 
3. Statisticile multivariate: sunt utilizate atunci când punem în comparaţie două sau mai multe 
caracteristici măsurate pe un grup de indivizi, relaţiile dintre interese, valori şi gradul de diferenţiere 
dintre diferitele curbe variationale, corelaţii multiple, calcularea regresiilor, calcularea de tip factorial. 
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5.2.CALITATILE METROLOGICE ALE TESTELOR PSIHOLOGICE 
Testele psihologice constituie instrumente verificate ale căror principale calități metrologice sunt: 
e fidelitatea 
e validitatea 


e standardizarea. 

Fidelitatea unui test se referă la consistenţa rezultatelor obținute de acelaşi subiect examinat la 
retestarea cu o probă identică sau o formă echivalentă. O stabilitate perfectă în timp a rezultatelor este 
dificil de obținut datorită variabilitatii comportamentale în funcție de factori fiziologici, motivationali, 
educationali etc. Al doilea aspect al fidelității îl reprezintă consistenţa internă, coerenţa prin eliminarea 
factorilor redundantei sau neomogeni cu conţinutul testului. Toți itemii testului trebuie să convearga spre 
obiectivul probei respective. 

Examinarea individuală a (itemilor testului are în vedere: stabilirea procentului de reuşită, eliminandu-se din 
test cei cu un procent de reuşită peste 80% şi cei cu procentaj sub 20%, şi a corelatiei item - test. 
Purificarea internă a testului este o condiţie centrală metrologică. 

Validitatea este înţeleasă azi ca un complex de măsurători care se referă la mai multe aspecte, 
centrate în principal pe problema în ce măsură testul măsoară ceea ce îşi propune să măsoare. Testul 
este util, deci are valoare diagnostică sau prognostică, în funcție de posibilitatea sa reală de a evidenția 
gradul în care este prezentă o anumită abilitate sau trăsătură măsurată, precum şi dacă este capabil să 
anticipeze realizarea unei performanţe într-o anumită activitate. Aceste virtuți specifice testului psihologic 
sunt condiţionate de validitatea sa. De exemplu, obiectivitatea testului este direct proporțională cu 
semnificaţia coeficientului de corelaţie (covariatie) dintre test şi criteriul practic. Un test căruia nu îi 
cunoaştem validitatea constituie doar un instrument de cercetare, nu un instrument psihodiagnostic, 
echivalent unei ipoteze. Pentru determinarea validității sunt necesare două categorii de date: rezultatele la 
test şi rezultatele la un tip de măsurători pentru comportamentul avut în vedere de test, denumit criteriu. De 
exemplu, în selecţia profesională se întâlnesc două tipuri de validare: predictivă şi concurentă, fiecare 
utilizabilă în anumite condiţii şi având astfel o semnificaţie restrânsă de limitele acestor condiţii de 
aplicare. 

Standardizarea se referă la posibilitatea de a obiectiva rezultatele unui subiect prin raportarea la 
performanţele obţinute la acelaşi test, în aceleaşi condiţii de administrare, de un eşantion reprezentativ de 
subiect. Interpretarea rezultatelor cere etalonarea testului, respectiv stabilirea unei scale care să permită 
reperarea facilă a performanţelor unui subiect în grupul total de performanţe al eşantionului reprezentativ, 
respectiv al grupului de persoane omogene subiectului sub raportul vârstei, nivelului educaţional, 
profesiunii etc. Rezultatele obținute de acest grup de persoane reprezentative pentru condiția subiectului 
testat se repartizează, de regulă, sub forma curbei lui Gauss, ceea ce permite calcularea performanţelor 
medii şi a dispersiei acestora. Media aritmetică a performanţelor la test este indicele care caracterizează 
tendinţa centrală a performanţelor acestor persoane, iar studiul variabilitatii rezultatelor (deviația 
standard sau abaterea standard) permite aprecierea specificului comportamentului acelui grup de 
persoane (comparativ cu un alt grup, cu o aceeaşi medie a performanţelor). 

Interpretarea deviatiei standard se realizează în funcție de proprietăţile distribuției normale: o 
abatere în plus şi în minus fata de medie acoperă relativ 68,26% din rezultate; două abateri standard, 
95,44%; 3 abateri standard acoperă virtual totalitatea rezultatelor, 99,72%. 

Câteva dintre proprietăţile curbei lui Gauss 

Atunci când măsurăm dimensiuni ale personalităţii sau performanţe se observă, în general, o 
tendință ca frecvenţa rezultatelor obţinute să se distribuie într-un grafic ce ia forma unui clopot. 
Această tendinţă reprezentată grafic ca un clopot se numeşte curba probabilității normale sau curba 
întâmplării deoarece descrie distribuţia cea mai probabilă a frecvenţelor unor evenimente aleatorii(este 
valabilă în primul rând în domeniul ştiinţelor naturii). Această curbă are importanţă statistică datorită 
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faptului că aproximează repartiţia normală(în sensul că dacă măsurătoarea s-ar face pe un număr 
infinit de cazuri- atunci rezultatul ar fi exact) a unor măsurători efectuate pe un eşantion reprezentativ. 

Specific curbei lui Gauss este simetria caracterizată prin aglomerarea spre centru a frecvenţelor 
cele mai mari şi scăderea lor treptată spre extremităţi. Spre exemplu- dacă testăm elevii privind 
cunoştinţele de istorie, printr-un test de cunoştinţe, vom observa că notele se vor distribui conform 
curbei lui Gauss. 


scoruri 


Pot însă să apară şi excepţii, caracterizate prin abateri de la simetria distribuţiei. Atfel, dacă 
testul este prea uşor atunci vor fi foarte multe rezultate foarte bune, mai puţine la medii şi slabe şi în 
acest fel curba va fi înclinată spre dreapta- spre performanţele bune. Dacă apar două vârfuri sau două 
clopote, atunci testul a pus în evidenţa două grupuri de elevi, foarte diferite. Dacă testul este prea 
dificil atunci rezultatele se vor aglomera spre stânga curbei, în zona performanţelor slabe, mai puţine 
la medie şi bune (este înclinată spre stânga). 

Curba lui Gauss stă la baza tuturor măsurătorilor biologice, psihologice, sociale etc., pe ea fiind 
clădită metoda statistică. Matematicianul german C.Fr. Gauss a avut ideea de a studia termenii 
dezvoltării binomiale pe cale geometrică, iar în domeniul măsurării diferențelor umane metoda a fost 
aplicată de Sir Francisc Galton. În 1869 el prezenta în lucrarea sa Hereditary Genius, un sistem de 
clasificare a indivizilor după aptitudinile pe care le posedă(aptitudine- dimensiune a personalităţii 
care-i asigură unui individ reuşita într-o activitate). El sublinia că persoanele superior dotate sunt 
extrem de rare(1 la 4000), şi că toate aptitudinile umane sunt distribuite potrivit curbei lui Gauss, în 
consecinţă indivizii pot fi clasificați în funcţie de proprietăţile cunoscute ale distribuţiei normale. În 
timp s-a constatat că nu întotdeauna curba lui Gauss este utilă, pentru că nu întotdeauna măsurătorile 
au o distribuţie normală. 

În practică, pentru a putea interpreta semnificaţia reală a rezultatelor unui subiect este necesar să le 
raportăm la rezultatele unei colectivități de referinţă, respectiv la un etalon sau tabel normativ. 

Sistemele de etalonare cele mai utilizate în psihologia aplicată sunt: cvartilele, decilele. clasele 
normalizate (în 5,7,9 şi 11 clase). Procedura practică de elaborare a etalonului este în funcție de distribuția 
de frecvenţă a cotelor brute. De exemplu, pentru distribuții asimetrice se preferă etaloanele in 
cvartile(4 clase), decile (10 clase) sau centile (100 clase). Pentru distribuții normale sunt adecvate 
etaloanele în clase normalizate. 

Colectivitatea de referinţă trebuie să constituie un eşantion reprezentativ din populaţia avută în 
vedere, iar etaloanele se raportează astfel la criterii precum: mediul din care provine populaţia (rural, urban), 
zona geografică, vârsta, sexul, nivelul educaţional. Se pot construi etaloane generale, cum este acela 
care are în vedere întreaga populaţie a unei tari, culturi, spaţiu geografic larg etc, sau etaloane locale, a 
căror utilitate este restrânsă la aria particulară de referinţă. 

Compararea rezultatelor la diferite teste este posibilă doar dacă acestea au la bază aceeaşi scară de 
notare. Nu se pot compara sau combina rezultatele exprimate în cote brute ale unui test de performanţă 
mnezică cu cele ale unui test de creativitate. Combinarea şi compararea cotelor nivelelor de performanţă, 
respectiv a gradului de semnificaţie a performanţei subiectului sunt posibile doar dacă le convertim în unităţi 


47 


Bazele teoretice ale evaluarii psihologice- Rezumat 


standardizate, cote standard şi cote standardizate. In psihologie sunt preferate mai multe tipuri de cote 
standard: variabilele normate Z(notele Z), variabilele T(notele T) si H (Hull). 

Standardizarea testelor înseamnă, de asemenea, standardizarea tehnicii de administrare, de 

cotare a răspunsurilor şi de interpretare a rezultatelor, aspecte care au ca scop uniformizarea 
condiţiilor în care are loc examenul psihologic. 
Toate aceste aspecte ale standardizării au în vedere obiectivitatea, respectiv eliminarea într-o măsură 
semnificativă a subiectivitatii examenului psihologic. Administrarea trebuie realizată în anumite 
condiții obligatorii şi cu un anumit tip de instructaj, acelaşi pentru toți subiecții testati. Dintre cerințe, 
semnificative sunt cele care privesc sala şi condiţiile de lucru, dar şi setul de cerinţe privitor la instructajul 
precis, clar, la timpul standard de exemplificare şi de testare propriu-zisă. Cu observația că, în examinarea 
psihologică, chiar şi în condițiile examenului psihometric, se cere un anumit grad de suplete a 
comportamentului celui care examinează, rigiditatea, respectiv standardizarea exagerată fiind la fel de 
negativă în consecinţe ca şi lipsa de standardizare. Acest lucru este semnificativ legat de faptul că, dintre 
factorii de influenţă, comportamentul examinatorului este doar un set de stimuli. Impactul acestui set de 
stimuli depinde însă şi de starea şi condiţia psihică a subiectului, respectiv, acelaşi comportament al 
celui care examinează(aceeaşi mimică, aceeaşi conduită verbală etc.) primeşte semnificaţii deosebite 
de la un subiect la altul (Cronbach, 1970). 


5.3. CONCEPTE-CHEIE IMPLICATE ÎN METROLOGIE: 
CONSTRUCT, DOMENIU DE CONȚINUT, GRUPE CONTRASTANTE, CRITERIU, 
VALIDITATEA DE ASPECT,VARIABILA MODERATOARE SI VARIABILA MEDIATOARE 


Construct 

Definiţie: un construct este. în genere, o idee construită(un model) de experţi pentru a reprezenta 
(rezuma) un grup de fenomene sau de obiecte şi pentru a fi utilizată într-un cadru ştiinţific (teoretic, 
metodologic sau aplicativ). 

Proprietăţi: După Murphy şi Davidshofer (1991), orice construct are două proprietăți: 

° este o abstractizare a unor regularitati din natură; 

. nu este observabil direct, dar poate fi conectat cu entităţi sau evenimente concrete, observabile. 
Constructele psihologice sunt evidenţiate, direct sau indirect, de comportament sau în urma 
conducerii unor experimente dedicate măsurării lor. 

Un construct psihologic, arată J.F. Binning şi G.V. Barett (Silva, 1993), este „o etichetă aplicată unei 
grupări de comportamente care covariază". 

Pentru Standards for Educaţional and Psychological Tests din 1985, constructul este o 
„noțiune teoretică derivată din cercetare si din alte experienţe, care a fost construită pentru a 
explica modele de comportament observabile". Constructele create pentru interpretarea rezultatelor 
testelor psihologice sunt identificate, de obicei, cu câte o clasă de răspunsuri (L. J. Cronbach, dupa 
Silva, 1993). 

Structura constructului: unii autori consideră constructele ca fiind multidimensionale, 
formate din „componente" independente unele de altele, numite uneori ,,fatete" şi recomandă utilizarea 
analizei factoriale ca metodă pentru studierea acestora. 

De exemplu, în modelul elaborat de Guilford, constructul ,,creativitate" are drept componente: 
fluiditatea,flexibilitatea, originalitatea, elaborarea, senzitivitatea față de probleme şi redefinirea 
(Landau, 1 979). 

Prezenţa componentelor ridică probleme in studiul relației dintre construct, privit ca variabilă 
independentă, şi o variabilă dependentă prezisă de construct. O posibilitate de rezolvare o reprezintă 
cotarea separată a componentelor, cumularea scorurilor şi cercetarea relaţiei dintre scorul total obţinut 
şi valorile variabilei dependente. Dar, uneori, componentele ar putea să prezică mai bine variabila 
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dependentă decât constructul general. In asemenea situaţii se studiază separat relaţia dintre fiecare 
componentă şi variabila dependentă (Ozer, Reise, 1994). 

Construct şi teorie psihologică: fiecare construct psihologic este fundamentat pe o teorie, 
care permite descrierea şi predicția, a comportamentelor legate de el, în situaţii specifice. 

Pentru elaborarea unui test care să îl măsoare, constructului i se asociază o variabilă cantitativă despre 
care se presupune că se află în relaţie crescătoare cu scorurile testului. Se formulează apoi o serie de 
afirmaţii referitoare la modul în care se comportă persoanele care au valori mari ale acestei variabile, 
comparativ cu cele care au valori scăzute. 

De exemplu, Guilford, în teoria tridimensională a intelectului se referă la constructul gândire 
divergentă reprezentând creativitatea şi diferitele comportamente asociate abilităţilor din care este 
formată aceasta, diferenţiate pe unităţi, clase, relaţii. 

Dorind să dezvolte un test de evaluare a motivatiei indivizilor pentru propria realizare, 
McClelland şi colaboratorii săi au formulat următoarele descrieri de comportamente (Thomdike, 
Haagen, 1961): 

e Persoanele care au o motivaţie puternică pentru realizare au rezultate şcolare bune. 

e Motivația pentru realizare este mai mare dacă subiecților li se administrează în prealabil teste despre 
care li se spune că măsoară inteligenţa. 

e Cei care au o motivaţie puternică pentru realizare completează mai multi itemi într-un test de viteză a 
cărui funcţie le-a fost explicată. 

e Motivația pentru realizare este mai mare la copiii a căror familie le-a încurajat de timpuriu 
independenţa. 

Fiecare dintre aceste descrieri este bazată pe un fel de „teorie a comportamentului uman". De 
exemplu, realizarea şcolară este văzută ca o combinaţie între aptitudinea şcolară şi efort. Dintre 
persoanele cu acelaşi nivel aptitudinal, cele care au o motivaţie mai marc pentru realizare depun un 
efort mai mare şi obţin rezultate şcolare mai bune (Thorndike, Haagen, 1961). 

Construct şi comportamente: Comportamentele prin care autorul testului consideră că se 
manifestă constructul pot fi influențate de diverse variabile, precum vârsta, sexul, educaţia primită etc. 
Pentru unele dintre acestea, legătura cu constructul poate corespunde unei situaţii reale, observată în 
populația căreia i se adresează testul şi acceptată de teoria care stă la baza constructului. Pentru altele, 
însă, ea denotă că aceste comportamente nu sunt caracteristice constructului. De asemenea, 
comportamentele prin care este descris constructul măsurat de test se pot asocia cu comportamente 
prin care se manifestă alte constructe psihologice, evaluate prin teste existente. 

Descrierea constructului: în consecință, elaborarea unui test care să măsoare un anumit 
construct impune descrierea constructului în termeni comportamentali concreti. Operația se numeşte 
explicarea constructului şi constă din următorii trei paşi (Murphy, Davidshofer, 1991): 

(1)Se identifică acele comportamente care au legătură cuconstructul măsurat de test. 

(2) Se identifică alte constructe şi pentru fiecare se decide dacă are sau nu legătură cu constructul 
măsurat de test. 

(3) Pentru fiecare construct se alcătuieşte o listă de comportamente prin care acesta se manifestă. 
Pentru fiecare comportament, pe baza relaţiilor dintre constructe, se decide dacă are sau nu legătură cu 
constructul măsurat de test. 

Rezultă astfel un sistem de relaţii care înglobează un set de constructe şi comportamente, denumit, de 
L. J. Cronbach, reţea nomologica („nomologică" în sensul că ea are la bază declaraţii exprimate sub 
formă de legi). Unii autori au folosit termenul de „reţea stohastica", susținând că relațiile dintre 
componentele rețelei sunt mai degrabă probabilistice decât de tip lege. 

O descriere amănunţită a constructului trebuie să conţină şi relaţiile acestuia cu cât mai multe variabile 
fiziologice, psihologice etc. 

De exemplu, dacă se urmăreşte realizarea unui test pentru evaluarea inteligenţei, se pot avea în vedere 
următoarele relaţii ale constructului ,,inteligenta" cu alte variabile (Gronlund, 1967; Kline, 1993): 

Scorurile testului cresc cu vârsta (se presupune că inteligenţa creşte cu vârsta aproximativ până 
la 16 ani). 

e Scorurile testului prezic succesul şcolar. 
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e Scorurile testului concordă cu aprecierile făcute de profesori 
despre inteligenţa elevilor. 

e Scorurile testului se corelează pozitiv cu scorurile unor teste aşa- 
numite „de inteligenţă”. 

e Daca se efectuează analiza factorială a acestui test şi a altor teste care măsoară 
aptitudini, se va constata că testul de inteligenţă are o saturație mare în primul factor 
general. 

e Scorurile testului discriminează între un grup de copii handicapati mintal şi unul format 
din copii capabili de performanţe superioare. 

e Scorurile testului sunt influențate doar putin de procesul instructional urmat de 
subiect. 

e Scorurile testului discrimineaza între diverse grupe ocupaţionale. 

Unele profesii, precum cea de matematician sau de funcționar superior, necesită o inteligenţă 
superioară, în timp ce altele pol fi exercitate şi de persoane cu o inteligenţă redusă, fiecare dintre 
afirmaţiile formulate în legătură cu constructul pe care testul trebuie să îl măsoare urmează să fie verificată 
experimental. Dacă unele dintre ele nu se confirmă, trebuie revăzută teoria care stă la baza constructului. 
pentru a sesiza eventualele omisiuni sau neconcordante. 


Domeniul de conţinut al unui test 

Definiţie: prin domeniul de conţinut al unui test se înţelege „mulțimea tuturor comportamentelor care 
pot fi utilizate pentru a măsura atributul specific sau caracteristica la care se referă testul" (Murphy, 
Davidshofer, 1991). 

Definirea domeniului de conţinut este asemănătoare celei de definire a unui construct. Autorul testului, 
pe baza ideii pe care şi-a format-o despre ceea ce vrea să măsoare, reține acele comportamente care 
presupune că ar fi manifestări ale constructului, respectiv, în cazul domeniului de conţinut, expresii ale 
performanţei sau ale cunoştinţelor subiecţilor. 

Deosebirea dintre un construct şi un domeniu de conţinut constă numai în gradul de abstractizare implicat 
şi adesea este dificil de făcut distincție între ele (Guion, 1986). 


Descrierea domeniului de conţinut trebuie, în primul rând, să precizeze limitele acestuia. Apoi, pentru 
fiecare componentă se apreciază importanţa. In cazul testelor destinate să măsoare rezultatele unui 
program de instruire (cunoştinţe sau deprinderi), descrierea domeniului de conţinut al testului se bazează pe 
analiza conţinutului şi a obiectivelor instructionale ale cursului urmat de persoanele care vor fi testate. Se 
încearcă să se includă în domeniul de conţinut aspectele pe care mai multi experţi le consideră importante. 
Exemplu: Un test de cunoştinţe de psihometrie, administrat studenţilor din anul II de la facultatea de 
psihologie, după predarea cursului de Psihodiagnostic, poate avea ca domeniu de conţinut „cunoaşterea 
noțiunilor de bază ale teoriei testelor, conform materiei predate la curs”. 

Descrierea domeniului de conţinut cuprinde: 

a) limitele domeniului: se au în vedere cunoştinţele cuprinse în bibliografia indicată la curs (se anexează 
lista bibliografică); 

b) componentele domeniului: 

e probleme: analiza de itemi, validitatea testelor, fidelitatea testelor; 

e aspecte tratate: definițiile noțiunilor, metodele de cercetare, 

condiţiile de utilizare a metodelor de cercetare şi a formulelor de calcul; 

c) importanţa relativă a componentelor domeniului: este indicată în tabel. Procentele se referă la timpul 
alocat fiecărei probleme în cadrul cursurilor predate studenţilor. 
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Problema Aspectul tratat 


Condiţii de utilizare 


itemi 


testelor 


testelor 


Grupele contrastante 

Definiţie: Grupele contrastante sau grupele extreme reprezintă două loturi de subiecţi care, printr-o 
variabilă (sau mai multe), au valori diferite extreme, respectiv un grup are valori foarte mari, celălalt valori 
foarte mici. 
Modul de formare a grupelor contrastante este dependent de numărul variabilelor alese şi de scala pe 
care acestea sunt măsurate. In cazul unei singure variabile dihotomice, cum este sexul, grupele 
contrastante corespund celor două valori ale variabilei. 
Daca pentru formarea grupelor contrastante se utilizează o singură variabilă, măsurată pe scală ordinala, de 
interval sau de raport, atunci se începe prin a ierarhiza persoanele pe baza valorilor acestei variabile. In 
prima grupă, denumită de obicei „grupa slabă", vor fi incluse persoanele cu valorile cele mai mici ale 
variabilei, iar în cealaltă grupă, denumită „grupa bună", persoanele cu valorile cele mai mari. în literatura 
de specialitate există recomandarea ca cele două grupe să conţină câte 27% din totalul subiecților. Dar, din 
motive practice (se poate întâmpla ca mai multe persoane să aibă aceeaşi valoare a variabilei), se acceptă 
ca procentul celor incluşi în fiecare grupă să fie cuprins între 25% şi 33%. 
Uneori, pentru formarea grupelor contrastante, este necesar să se ia în considerare mai multe variabile, 
fiecare fiind măsurată pe scală ordinală, de interval sau de raport. Aşa se întâmplă, de pildă, când grupele 
trebuie să conțină persoane „cu succes profesional" şi, respectiv, persoane „cu insucces profesional”, iar 
performanţa profesională se exprimă prin valorile mai multor variabile. In asemenea situaţii, se procedează 
la ierarhizarea persoanelor după valorile fiecărei variabile şi la agregarea clasamentelor astfel formate. Din 
ierarhia rezultată se aleg cei aliaţi la extreme, ca şi în cazul descris mai sus. 


Criteriul 

Definiţie: Prin criteriu se înţelege „o variabilă pe care încercăm să o prevedem în general cu ajutorul 
testelor”, sau „o măsură acceptată a comportamentului evaluat de test". Criteriul, în aprecierea personalului, 
este „o măsură a nivelului de performanță exprimată în termeni cantitativi, bazată pe o descriere 
completă a muncii prestate". 

Dimensiunile criteriului: variabila-criteriu poate fi unidimensională sau selecția profesională a 
managerilor o variabilă criteriu poate fi constituită multidimensională, cu valori cantitative sau/şi calitative. 
De exemplu, în criteriul „eficienţă managerială" format din abilitatea de comunicare şi din capacitatea de 
organizare (apreciate prin câte un calificativ), din sociabilitate, persuasiune şi ambiţie (măsurate cu ajutorul 
unor scale, deci având valori numerice). 

De exemplu, performanţa în muncă este, de asemenea, un criteriu multidimensional. 
In compoziţia sa intră aspecte ce tin de (Gilmer, 1971; Pitariu), 1994): 
e cantitatea realizată în unitatea de timp (piese produse, cuvinte dactilografiate, itemi codificati etc); 

e calitatea muncii (număr de piese rebutate, număr de erori de codificare etc); timpul de munca 
neutilizat (absente, întârzieri, pauze neautorizate etc); 

e stabilitatea în muncă (vechimea in muncă, schimbări de profesie, transferări, demisii etc); 

e costul necesar pentru instruire (timpul de instruire pentru realizarea unei producții standard, costul 
materialului stricat în timpul instruirii, viteza de avansare etc); 

e cunoştinţele profesionale; 

e satisfacția in muncă (număr de revendicări, de sugestii, examinări psihiatrice etc); 
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e evaluările facute de superiori sau de colegi. 

Se recurge adesea la verificarea corectitudinii unui test, în cadrul operației de validare a testului, prin 
compararea scorurilor sale cu măsurile unui criteriu, atunci când testul trebuie să înlocuiască variabila-criteriu, fie 
din cauză că valorile variabilei-criteriu nu sunt cunoscute în momentul testării, lle pentru că administrarea testului 
este mai puţin costisitoare decât măsurarea variabilei-criteriu. 


Condiţii: Pentru a face posibilă aprecierea corectă a calităților testului cercetat, criteriul trebuie să 
îndeplinească următoarele condiţii (adaptare după Greuter, Algera, 1989 şi Corsini, 1994): 

1. Să fie relevant pentru activitatea sau caracteristica la care se referă, adică ordinea subiecților determinată 
pe baza valorilor criteriului să corespundă ordinii reale a acestora în privinţa succesului obținut în activitatea 
respectivă sau a mărimii caracteristicii măsurate. Pentru aceasta este necesar ca variabila-criteriu să ia valori într-o 
mulțime total ordonată ori să realizeze o măsurare pe scală ordinală, de interval sau de raport. De obicei se preferă 
criteriile cu valori cantitative. 

2. Să fie fidel, adică să concorde cu diverse evaluări ale performanţelor la care el se referă, făcute la 

momente diferite şi/sau cu alte instrumente de măsură, similare lui. Verificarea acestei condiţii se poate face cu 
ajutorul coeficientului de corelaţie. 
Să fie practic, adică să nu coste mult şi să fie acceptabil pentru cei care doresc să îl utilizeze la luarea deciziilor. 
Pentru îndeplinirea acestei condiţii, este important ca în criteriu să fie înglobate principalele aspecte care sunt avute în 
vedere la aprecierea performanţei sau a mărimii caracteristicii măsurate. Identificarea acestora se poate face 
apelând la supervizori, respectiv la experţi. 

4. Să fie exprimat în aceleaşi unităţi sau în unităţi comparabile pentru toate persoanele. De exemplu, dacă 
valorile variabilei-criteriu sunt dependente de vârsta subiecţilor, atunci aceste valori vor fî transformate în cote 
standardizate, pentru fiecare persoană fiind utilizate în formula de transformare media şi abaterea standard 
corespunzătoare grupei de vârstă din care aceasta face parte. 

5. Atunci când criteriul este multidimensional, valoarea criteriului pentru fiecare persoană să reflecte atât 
importanţa diverselor componente, cât şi nivelul individului la fiecare dintre ele. 


În Criterii pentru analiza validității testelor care măsoară conslructe: Anastasi (1954) enumera câteva criterii 
utilizate în practica psihologică pentru analizarea validității testelor care măsoară constructe. Acestea sunt: 

a. Vârsta: se foloseşte drept criteriu pentru testele de inteligenţă, întrucât se consideră că scorurile acestora 
trebuie să crească pe parcursul copilăriei, până la maturitate. Nu este un criteriu bun pentru testele care măsoară 
funcțiuni psihice invariabile sau puţin variabile în timp, cum sunt variabilele de personalitate. 

b. Cunostintele şcolare, exprimate prin note şcolare, rezultate lateste de cunoştinţe ori evaluări tăcute de 
profesori asupra „inteligenței "elevilor: sunt adesea criterii pentru testele care măsoară aptitudinea şcolară. 

c. Performanţele la diverse programe de instruire specială cum sunt cursurile de dactilografie, programare, 
muzică etc: furnizează criterii pentru teste de aptitudini speciale. 

d. Performanţa profesională serveşte uneori drept criteriu pentru teste de personalitate. 

e. Evaluările făcute de profesori, instructori sau superiori sunt folosite mai mult pentru a obţine informații 
despre alte criterii, cum ar fi cunoştinţele şcolare, performanţa la diverse cursuri, reuşita profesională. Au rol de 
criteriu pentru unele teste care măsoară trăsături psihice precum anxietatea, onestitatea, originalitatea etc. 

f. Rezultatele altor teste se utilizează ca şi criteriu atunci când se urmăreşte să se construiască un test care să 
măsoare acelaşi lucru ca şi criteriul, dar să fie mai uşor de administrat sau/şi de cotat, ori să fie mai ieftin. De 
exemplu, scala Stanford- Binet a servit drept criteriu pentru multe teste de inteligenţă. 

g. Grupele contrastante reprezintă de obicei un criteriu multidimensional, care cuprinde aspecte diverse 
din viaţa zilnică. De exemplu, pentru un test de inteligenţă, grupele contrastante pot fi constituite dintr-o clasă de 
copii proveniţi de la o şcoală de debili mintali şi o clasă de elevi de aceeaşi vârstă dintr-o şcoală obişnuită. Criteriul 
pe baza căruia s-au format grupele este alcătuit din ansamblul de factori care au determinat cuprinderea copiilor în 
şcoala ajutătoare. Grupele contrastante se folosesc frecvent ca şi criteriu pentru testele de personalitate. De 
exemplu, pentru evaluarea unor trăsături legate de activitatea socială se poate forma o grupă de studenți cu 
multiple preocupări extraşcolare şi una cu studenţi fără asemenea preocupări. 


Clasificarea criteriilor: Criteriile utilizate în cercetările asupra comportamentului pot fi clasificate din două 
puncte de vedere, ambele permiţând plasarea criteriilor de-a lungul unei axe (Barclay, 1968). Astfel: 

e după modul de obţinere a valorilor lor, la un pol se plasează criteriile subiective (valorile sunt furnizate de 
subiect), iar la celălalt, cele obiective (valorile sunt obţinute de la alte persoane sau cu ajutorul unor instrumente de 
măsură); 

e după gradul în care valorile lor sunt dependente de contextul în care se află persoana evaluată, la un pol se 
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află criteriile individuale (valorile sunt independente de contextul în care se află persoana), iar la celălalt, cele de 
grup (comportamentele sunt puternic influențate de grupul din care face parte persoana evaluată cu ajutorul 
criteriului). 

De exemplu, criterii subiective individuale sunt afirmaţiile făcute de subiect despre nivelul său de aspirație şi 
despre valorile sale spirituale, în timp ce criterii subiective de grup sunt relatările subiectului despre relaţiile sale cu 
alte persoane, despre recompensele şi pedepsele pe care le-a primit. 

Criterii obiective individuale sunt tehnicile Q-sort, iar dintre criteriile obiective de grup fac parte evaluările 
realizate de profesori şi observaţiile sistematice asupra comportamentului. 


Mulțimea de criterii: Adesea, pentru un acelaşi test se găsesc mai multe criterii, fiecare 
referindu-se la un alt aspect. Aşa se întâmplă, de pildă, când testul trebuie să prevadă reuşita 
profesională. 

In asemenea cazuri există două posibilităţi de a acţiona, pentru a le lua în considerare pe toate: 

a) se combină criteriile într-un criteriu compus sau global; pe baza scorurilor criteriilor se 

calculează pentru fiecare persoană o cotă unică; 

b) se reunesc criteriile într-un criteriu multiplu: fiecare criteriu are o valoare particulară şi 

este utilizat separat în aprecierea testului. 
Prima variantă de lucru este mai convenabilă în privinţa prelucrării şi a interpretării datelor, întrucât 
fiecare persoană are un singur scor, care permite ierarhizarea candidaţilor. Pentru aplicarea sa, este 
necesar, însă, ca scorurile criteriilor să fie exprimate în aceleaşi unităţi de măsură: în scoruri 
standardizate, în ranguri, în unități de timp sau în costuri. 
Exemplu: Pentru munca de editare a textelor la calculator se pot fixa două variabile criteriu: 

e numărul de semne introduse într-o oră; 

e numărul de erori comise la introducerea acestor semne. 
Cu ajutorul acestor criterii se poate forma un criteriu global, care exprimă timpul necesar pentru a 
introduce corect un număr fixat de semne, N. Valoarea criteriului global, pentru fiecare persoană, se 
calculează însumând timpul în care sunt introduse cele N semne cu timpul necesar pentru depistarea 
erorilor comise şi corectarea lor. Prin combinarea criteriilor într-un criteriu global şi ierarhizarea 
persoanelor pe baza scorului astfel calculat se rezolvă o problemă de agregare a mai multor 
clasamente: ierarhiile de pornire (corespunzătoare scorurilor criteriilor) se înlocuiesc cu un singur 
clasament. 

Nota globală: în practica selecției profesionale se obişnuieşte să se combine liniar, ponderat 
sau neponderat, scorurile criteriilor pentru a obţine o cotă globală. în privinţa modului de stabilire a 
ponderilor, părerile sunt diverse. De exemplu, H. Toops (Brogden, Taylor, 1949) consideră că 
ponderile trebuie să reflecte importanţa fiecărui criteriu, apreciată de specialişti, în timp ce M.L. Blum 
şi J.C. Naylor (1968) propun ca ponderile să fie proporționale cu fidelitatea criteriilor. 
Procedeele de agregare a clasamentelor care însumează scorurile ponderate ale criteriilor prezintă un 
neajuns atunci când ierarhiile corespunzătoare criteriilor nu concordă între ele. Astfel, este posibil ca 
pe primele locuri ale ierarhiei finale să ajungă persoane care au obținut scoruri modeste la mai multe 
criterii, dacă ele s-au aflat pe locuri fruntaşe în clasamentele corespunzătoare criteriilor cărora li se atribuie 
ponderi mari.Acest inconvenient poate avea urmări grave atunci când criteriile nu au un caracter 
compensatoriu. Dacă existenţa unor cunoştinţe sau deprinderi este absolut necesară desfăşurării cu 
succes a activităţii pentru care se face selecţia şi nu poate fi compensată prin alte calităţi ale persoanei, 
de asemenea necesare postului, aceste cunoştinţe sau deprinderi trebuie să constituie un criteriu care 
nu va putea fi, sub nici o formă, inclus într-un criteriu global (Landy, 1985). în asemenea situaţii 
trebuie să se utilizeze un criteriu multiplu. 


Validitatea de aspect a testelor 


Definiție: Orice test psihologic sau educaţional destinat utilizării în practică trebuie să fie 
perceput de cei examinati cu el ca fiind adecvat domeniului în care este aplicat. Această calitate a 
testelor este denumită validitate de aspect (C. 1. Mosier, dupa Nevo. 1993). 

O definiție operaţională a validitatii de aspect a fost formulată de 1 . Guttman şi S. Shye (Nevo, 
1993) astfel: „Se face o măsurare a validității de aspect atunci când o persoană testată/un utilizator 
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neprofesionist/un individ interesat, utilizând o tehnică absolută /relativă apreciază un unu/ un test/o 
baterie de teste drept foarte potrivit/nepotrivit pentru utilizarea care îi interesează" 

I rebuie observa) că aprecierea validității de aspect nu este realizată de experţi şi pentru 
măsurarea sa nu se folosesc metode psihometrice. Dacă aprecierea validității de aspect este făcută de 
persoanele testate, ele trebuie să îşi spună părerea imedial (după terminarea testului, când impresiile 
sunt încă proaspete. Validilalea de aspect nu este inclusă printre celelalte tipuri de validitate 
(Standards for Educational and Psychological Tests, 1974) şi nici nu le poate înlocui. 


Variabile moderatoare, variabile mediatoare 


Variabilă moderatoare 

Definiţie: Noţiunea de variabilă moderatoare are mai multe acceptiuni. 

In termeni generali, o variabilă moderatoare este o variabilă calitativă (de exemplu, sexul, rasa, 
clasa socială) sau cantitativă (de exemplu, vârsta, anxietatea), care afectează direcția şi/sau tăria 
relaţiei dintre o variabilă independentă şi o variabilă dependentă (Baron, Kenny, 1986). 

Unii autori înţeleg prin variabilă moderatoare „o interacțiune între mai multe variabile care 
influenţează corelatiile uneia dintre variabile cu alte date" (Mischel, 1968). 

Procedeu: Procedeul statistic utilizat pentru a verifica dacă o variabilă independentă acționează 
sau nu ca o variabilă moderatoare este determinat de felul în care au fost măsurate variabila 
independentă şi variabila moderatoare. Se face distincţie între cazul când variabilele sunt categoriale, 
adică discrete, măsurate pe scală nominală sau ordinală, şi cel în care ele sunt continue, măsurate pe 
scală de interval sau de raport. 

Atunci când variabila dependentă este continuă, sunt posibile următoarele situaţii (Hofstee, 
Smid, 1986; Baron, Kenny, 1986): 

1. Variabila independentă şi variabila moderatoare sunt ambele categoriale. 

în acest caz se aplică analiza de variantă bidimensională pentru a cerceta efectul variabilei 
independente şi al variabilei despre care se presupune că este moderatoare asupra variabilei 
dependente. Existenţa efectului moderator este indicată de prezenţa interdependentei dintre variabila 
independentă şi cea moderatoare. 

2. Una dintre cele două variabile (independentă şi moderatoare) este continuă, iar cealaltă 
categorială. in acest caz se determină ecuaţia de regresie a variabilei dependente fata de variabila 
continuă, pentru fiecare valoare a variabilei categoriale. Dacă există un efect moderator, atunci 
dreptele de regresie nu sunt paralele. 

3. Variabila moderatoare şi variabila independentă sunt ambele continue. 


Variabilă mediatoare: 


Definiție: O variabilă U acţionează ca mediator între variabila independentă X şi cea dependentă 
Y dacă sunt îndeplinite următoarele condiţii (Baron, Kenny, 1986): 

e variaţia valorilor variabilei independente provoacă variaţia valorilor variabilei mediatoare; 

e variaţia valorilor variabilei mediatoare determină variaţia valorilor variabilei dependente; 

e relaţia dintre variabila independentă şi cea dependentă este semnificativă, dar devine slabă sau 
chiar inexistentă atunci când sunt controlate relațiile dintre variabila independentă şi cea mediatoare şi 
dintre variabila mediatoare şi cea dependentă. 

Procedeul statistic: Procedeul aplicat pentru verificarea existenţei efectului mediator constă în 
construirea ecuaţiilor de regresie. 

Medierea perfectă apare atunci când variabila mediatoare fiind controlată, variabila independentă 
nu are nici un efect asupra variabilei dependente. 

în general, în cercetările psihologice, mediatorii sunt diverse caracteristici ale persoanelor care 
transformă variabila de intrare în variabila de ieşire. 

Utilizare: Variabilele moderatoare sunt utilizate atunci când relația dintre variabila independentă 
şi cea dependentă este slabă, ea modificându-se de la o subpopulatie la alta. De exemplu, gradul în 
care o trăsătură psihică este relevantă pentru subiecți acționează ca variabilă moderatoare dacă 
trăsătura trebuie să prezică un anumit comportament. 

Variabilele mediatoare se folosesc atunci când există o relație strânsă între variabila 
independentă şi cea dependentă. Uneori, în spatele unei variabile moderatoare se află o variabilă 
mediatoare. 

De exemplu: O cercetare privind anxietatea fata de calculator a studenţilor psihologi (Pitariu, 
Albu, 1995) a evidenţiat faptul că între extraversie şi convingerea studenţilor că nu pot învăţa să 
lucreze la calculator (unul dintre factorii anxietatii față de calculator) intervine, ca variabilă 
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mediatoare, modul în care subiecţii îşi apreciază cunoştinţele de informatică (nota pe care şi-o acordă). 
Variabila mediatoare se corelează pozitiv cu extraversia şi negativ cu factorul anxietatii fata de 
calculator. 

Pe de altă parte, autoaprecierea subiecților se corelează liniar pozitiv cu nivelul real al 
cunoştinţelor de informatică ale acestora, care este strâns legat de profilul liceului absolvit (liceu de 
matematică-fizică, de filologie, de arte etc). Dacă cercetarea s-ar fi restrâns la mai puţine variabile, 
neluând în considerare nivelul cunoştinţelor de informatică autoapreciat sau apreciat obiectiv, s-ar fi 
constatat că profilul liceului absolvit joacă rol de variabilă moderatoare între extraversie şi anxietatea 
faţă de calculator. 

In unele situaţii, o variabilă poate acţiona atât ca moderator, cât şi ca mediator. De exemplu, 
autoeficienta (care a fost definită de A. Bandura ca „aprecierea făcută de individ asupra capacităţii 
proprii de a organiza şi executa acţiunile necesare pentru a atinge o anumită performanţă”) 
funcționează ca: 

e mediator între situaţia de lucru apreciată din punctul de vedere al complexităţii lucrului şi al 
controlului deţinut de subiect şi iniţiativa personală; aceasta înseamnă că atât controlul pe care îl are 
subiectul asupra muncii, cât şi complexitatea lucrului au un efect direct asupra autoeficientei sale şi 
aceasta are efect direct asupra inițiativei personale; 

e moderator în relaţia dintre situația de lucru şi inițiativa personală; relaţia dintre controlul 
deţinut de subiect şi complexitatea lucrului, pe de o parte, şi iniţiativa personală, pe de altă parte, este 
dependentă de nivelul de eficienţă perceput de persoană (Speier, Frese, 1997). 
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6. CARACTERISTICI METROLOGICE ALE TESTULUI: 
FIDELITATEA 


6.1. Definitia fidelitatii 

6.2. Rolul coeficientului de fidelitate si eroarea standard a masurarii 
6.3. Metode pentru evaluarea fidelitatii testelor 

6.4. Observatii asupra metodelor folosite pentru estimarea fidelitatii 
6.5. Factorii care intervin in estimarea coeficientilor de fidelitate 
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6.6. Interpretarea coeficienţilor de fidelitate 


6.1. DEFINIȚIA FIDELITATII 


Termenul fidelitate- în limbajul curent se asociază cu încrederea. În ştiinţele sociale şi 
comportamentale, măsurătorile sunt mult mai predispuse la eroare datorită naturii intangibile a 
constructelor care sunt evaluate şi datorită faptului că o mulţime de factori dificil de controlat pot 
afecta comportamentele. Scorurile testelor psihologice sunt în special susceptibile să fie influențate de o 
mulţime de surse: persoana examinată, examinatorul, contextul examinării — toate acestea pot determina variaţii 
străine sau opuse scopului testării. 


1. 1954 şi 1966, în Standards For Educational And Psychological Tests- „Fidelitatea reprezintă 
precizia, consistenţa şi stabilitatea măsurării realizate de test” 

2. 1974- în aceleaşi standarde „fidelitatea este definită prin gradul în care rezultatele testării pot fi 
atribuite surselor sistematice de variaţie” 

3. 1985- în aceleaşi standarde „fidelitatea este gradul în care scorurile testului sunt consistente 
sau repetabile, adică gradul în care ele nu sunt afectate de erorile de măsură” 

4. 2004- Susana Urbina- „În contextul testării erorile de măsură pot fi definite ca fiind orice 
fluctuatie a scorurilor care rezultă din factori ai măsurării, irelevanti pentru ceea ce se măsoară. 
Definim atunci fidelitatea ca o calitatea a scorurilor testului care sugerează că sunt suficient de 
consistente şi libere de erori de măsură astfel încât să fie folositoare.” 


Fidelitatea este o caracteristică a scorurilor testului , mai degrabă decât a testului in sine. Fidelitatea oricărei 
măsurători, psihologice în particular, nu este absolută sau imuabilă. De aceea posibilele surse de eroare şi măsura 
în care se pot manifesta trebuie luate în considerare, estimate, şi raportate de fiecare dată când testele sunt aplicate. 


Un test dispune de dovezi ale fidelității măsurătorilor dacă: 

e Este lipsit de erori de măsură 

e Orice persoană obţine scoruri egale la test şi la o formă paralelă a testului, când erorile de 
măsură la cele două teste sunt independente 

Criterii pentru fidelitatea tehnică: 
e Dispersia rezultatelor să fie mare 
e Distribuţia rezultatelor să fie normală 
e Rezultatele aceluiaşi subiect să fie asemănătoare la retestare 
e Pentru testele colective, fidelitatea să fie mai mare decât la cele individuale 


6.2. ROLUL COEFICIENTULUI DE FIDELITATE ŞI EROAREA STANDARD A 
MASURARII (SEM) 


Coeficientii de fidelitate se utilizează la compararea testelor.Eroarea standard a măsurării — SEM- este 
utilizată la interpretarea scorurilor testului- adică la determinarea intervalelor de încredere pentru 
scorurile reale ale subiecţilor. 

Formula de calcul: 


SEM= oxvl-—rit 
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o= abaterea standard a scorurilor testului(deviatie standard- SD) 
rtt= coeficientul de fidelitate pentru lotul testat 


Se poate observa că valoarea SEM este cu atât mai mică cu cât coeficientul de fidelitate este mai mare. 
Spre exemplu dacă scorul la un test de inteligenţă pentru un subiect este de 1Q=1 10, iar SEM este 5, 
alături de scorul obţinut trebuie să luăm în considerare şi variația posibilă a scorurilor, adică + 3SEM, 
pentru încrederea maximă(99%)= + 15. Este posibil ca scorul real al subiectului să fie 110, dar la fel 
de posibil să fie oricare altul în intervalul de încredere [95/4125]. Dacă încrederea ste de 95% atunci 


scorul se paote afla în intervalul 110+ 2 SEM, adică între 100 şi 120. 


Sursele de variaţie a erorii şi tipul de fidelitate care pune în evidenţă măsimea erorii: 


1. egantionarea timpului- fidelitatea test- retest pune în evidenţă stabilitatea în timp a rezulatelor 
unei persoane 

2. eşantionarea continutului-fidelitatea prin corelatia între formele alternative(aplicare 
imediată) pune în evidenţă erorile de eşantionare a conţinutului 

3. eşantionarea conţinutului şi a timpului- fidelitatea prin corelatia între formele alternative(la 
interval mai mare de timp) 

4. eşantionarea conţinutului şi eterogenitatea acestuia (inconsistenta între itemi) - fidelitatea 
calculată prin metoda injumatatirii, sau metoda Kuder-Richardson, sau Alfa- Cronbach 

5. diferenţe între evaluatori- fidelitatea interevaluatori pune în evidenţă erorile datorate acestor 
diferenţe 

6.3. METODE PENTRU EVALUARE FIDELITATII TESTELOR 
Metode: 


Metoda test- retest 

Metoda analizei consistentei interne 
Metoda formelor paralele 

Coeficienti de fidelitate interevaluatori 


Pentru un test, în funcție de ceea ce măsoară şi de condiţiile în care a fost administrat, se calculează 
unul sau mai mulţi dintre următorii coeficienți, prin care se aproximează valoarea coeficientului de 
fidelitate: 

A. coeficienţii de stabilitate- metoda test-retest (stabilitate în timp) 

B. coeficienţi de echivalență- metoda formelor paralele, prin corelarea scorurilor obţinute la două 


teste paralele, administrate aproape în acelaşi timp(arată cât de asemănătoare sunt cele două 
instrumente de măsură) 

coeficienţii consistentei interne- pe baza scorurilor obţinute un test administrat o singură dată- 
coeficientul@ al lui Cronbach, coeficientul lui Guttman, şi coeficienții Kuder- 
Richardson(exprima concordanta diferitelor parti ale testului) 

coeficienţii de fidelitate interevaluatori- se calculează pentru teste al căror scor este 
rezultatul aprecierii subiective făcute de evaluator(arată în ce măsură părerile unor evaluatori 
concordă între ele). 


Metoda test-retest 


57 


Bazele teoretice ale evaluarii psihologice- Rezumat 


Este utilă când scorurile reale ale testului măsoară caracteristici durabile, generale şi specifice ale 
persoanelor. Se consideră că factorii temporari nu modifică scorul real al persoanei, ci influenţează 
erorile de măsură. 
Procedură: 

1. administrarea testului unui grup 

2. după un interval de timp(nu mai puţin de trei luni, şi nu mai mult de şase luni- P.Kline, 2000) 

se administrează acelaşi test, aceloraşi persoane, în aceleaşi condiţii 

3. se calculează coeficientul de corelaţie liniară între scorurile obţinute la cele două testări 
La testele de aptitudini şi de cunoştinţe corelatia dintre scoruri nu măsoară fidelitatea, uneori, măsoară 
schimbarea nivelului cunoştinţelor sau aptitudinilor. 
Când valoarea coeficientului de corelaţie liniară test-retest este apropiată de l- atunci se poate să 
existe şi situația când testul nu este potrivit pentru grupul de subiecți- este foarte greu sau foarte uşor, 
deci intrepretarea coeficientului trebuie însoțită de analiza formei histogramelor scorurilor observate la 
test şi retest. 
Când se comunică valoarea coeficientului de stabilitate se mai comunică şi: 

e Lungimea intervalului de timp dintre test şi retest 

e Condiţiile în care s-au efectuat testările(surse posibile de eroare) 

e Vârsta subiecţilor testati 
Atunci când testul este utilizat pentru decizii, prin plasarea subiecţilor în categoria „admis” sau 
„respins” (scorul mai mare sau mai mic decât pragul de admitere- cut off score)- este considerat stabil 
dacă nu se produc modificări în clasarea subiecților. 
Dezavantaj- necesită timp şi cheltuieli materiale- pentru administrarea de două ori. 


Metoda analizei consistentei interne 
Consistenta internă înseamnă că itemii testului se referă la acelaşi lucru. Pentru a afla consistenţa se 
pot calcula unul din trei coeficienti(cel adecvat situaţiei): 
e Alfa &- al lui Cronbach(1943)- este utilizabil când subiecţii răspund pe o scală cu mai multe 
trepte(ex. 3, 5 sau 7, pentru cinci trepte- ex. niciodată - foarte rar - uneori - foarte des - 
întotdeauna, unde niciodată înseamnă 1 , întotdeauna înseamnă 5) 


Txx (Sau 0) = ------- ( 1- -------- ) în care: 


SD; = suma variantelor la scorurile totale ale testului 
(SDi) = suma variantelor la scorurile fiecărui item al testului 
n = numărul de itemi ai testului 


Lamda à,- al lui Guttman(1968) 


e r20saur2l ai lui Kuder-Richardson(1939)- se aplica atunci când răspunsurile sunt de tipul 
DA-NU, Adevărat-Fals(binare) 
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Tu = coeficientul de fidelitate al întregului test 
n = numărul de itemi ai testului 
SD, = deviația standard a scorurilor totale ale testului 
>pq = suma produselor persoanelor care reuşesc şi a celor 
care nu reuşesc la fiecare item 


Metoda este utilă atunci când testul măsoară o caracteristică unidimensională, şi arată cât de bine 
fiecare item măsoară aceeaşi caracteristică. Testul trebuie administrat fără limită de timp, astfel încât 
toți subiecţii să termine testul. Pentru o consistenţa internă bună trebuie aleşi itemii cu dispersii mici 
ale scorurilor şi corelaţii mari cu scorul total al testului. 

Dacă un test are n itemi paraleli, atunci coeficientul său de fidelitate se măsoară cu formula lui 
Spearman- Brown: 


Myiy2 


p= 
UGE Dar as 


Se observa ca fidelitatea testului depinde de numărul itemilor componenti(in teoria clasică a 
psihometriei). Din această formulă se poate afla de câte ori trenuie lungit sau scurtat testul, prin itemi 
paralei, astfel încât fidelitatea să fie egală cu o valoare fixată. 


Metoda formelor paralele 


Constă în administrarea a două teste, care reprezintă instrumente de măsură paralele, la momente 
foarte apropiate unul de altul, şi determinarea coeficientului de corelaţie liniară între scorurile 
observate ale celor două forme. Valoarea calculată se numeşte coeficient de echivalență. Dacă cele 
două teste sunt paralele şi dacă pentru fiecare persoană erorile de măsură la cele două administrări 
sunt variabile aleatoare independente, atunci coeficientul de echivalență coincide cu coeficientul de 
fidelitate al fiecărui test. 

Metoda formelor paralele este potrivită în cazul când se urmăreşte măsurarea unor 
caracteristici generale ale persoanelor. Asemenea caracteristici vor influenta în acelaşi mod scorurile 
ambelor teste. 

Metoda formelor paralele prezintă unele avantaje fata de metoda test- retest: cele două forme 
fiind diferite, rezultatele la cel de-al doilea test nu sunt influențate nici de memorarea răspunsurilor 
date la primul test şi nici de aflarea răspunsurilor la întrebările Ia care nu s-a ştiut răspunde (în cazul 
testelor de aptitudini sau de cunoştinţe). 

Dar, metoda formelor paralele are inconveniente. Dintre acestea amintim următoarele: 

e sunt necesare două administrări separate, ceea ce consumă timp; 

e intervine oboseala sau plictiseala persoanelor examinate, ceea ce influenţează scorurile la 
cel de al doilea test 

e elaborarea unor forme paralele poate fi dificilă şi costisitoare 


Metoda se mai foloseşte şi atunci când se doreşte obținerea unei colecţii de teste paralele, de bună 
calitate. 


Un caz particular îl constituie metoda injumatatirii(half-split). Uneori este considerată ca metodă de 
analiză a consistentei interne. Pentru că e dificil să se creeze forme paralele se procedează altfel: 
e Se administrează testul 
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e Se împarte în două jumătăţi cât mai asemănătoare 

e Se calculează coeficientul de corelaţie între cele două jumătăți. 
Daca jumatatile testului sunt instrumente de măsură paralele atunci valoarea calculată reprezintă 
coeficientul de fidelitate al fiecăreia dintre ele. Aplicând formula Spearman- Brown se calculează 
coeficientul de fidelitate pentru întreg testul. Metoda nu se aplică atunci când administrarea testului se 
face cu limită de timp. Această metodă rezolvă multe din inconvenientele metodei test-retest şi a 
formelor paralele, dar are şi dificultăți- itemii slectati în cele două jumătăţi trebuie să fie echivalenți, şi 
independenţi. 
Coeficientul de fidelitate interevaluatori 
Se utilizează în cazul testelor care nu au o cotare obiectivă- cum ar fi cele proiective sau cele de 
creativitate. Pentru a vedea în ce măsură scorurile sunt dependente de cel care a făcut cotarea se 
calculează coeficientul de corelaţie liniară între scorurile atribuite aceloraşi subiecți de către evaluatori 
diferiţi. Unii autori recomandă pentru aprecierea acordului între evaluatori a coeficientului K al lui 
Cohen, care ia valori între +1 şi -1, şi indică în ce măsură concerdanta evaluărilor este diferită de cea 
datorată întâmplării. 


6.4. OBSERVAȚII ASUPRA METODELOR FOLOSITE PENTRU 
ESTIMAREA FIDELITATII 


Alegerea metodei aplicate trebuie să ţină seama de ceea ce măsoară testul, de scopul pentru 
care el var fi folosit şi de condiţiile concrete în care se poate face testarea (există sau nu posibilitatea 
administrării repetate a testului, există sau nu forme paralele ale testului etc). 

Când testul măsoară o caracteristică durabilă şi, deci, trebuie să fie puţin sensibil la situația de 
testare, sau când pe baza scorurilor testului urmează să se tragă anumite concluzii valabile pentru o 
perioadă de timp mai îndelungată, se va aplica metoda test - retest. 

In situaţia când nu se poate asigura retestarea persoanelor după un interval de timp suficient de 
lung pentru ca subiecţii să nu îşi mai poată aminti răspunsurile date la test, dar există o formă paralelă 
a testului, se va utiliza metoda formelor paralele. In cazul particular, când forma paralelă a testului a 
fost administrată împreună cu testul, se va putea aplica metoda înjumătățirii. 

Dacă se ştie că testul se compune din itemi care măsoară aceeaşi caracteristică - mai mult sau mai 
puţin durabilă - pentru estimarea coeficientului de fidelitate, se va folosi o formulă de calcul al unui 
coeficient de consistenţă internă. 

Pentru testele unde nu se poate realiza o cotare strict obiectivă, evaluatorul devine o componentă 
a procesului de măsurare realizat cu ajutorul testului. Alături de o altă metodă de estimare a fidelității 
se va calcula şi coeficientul de fidelitate interevaluatori. 


In general, valorile coeficienţilor de consistenţă internă sunt mai mari decât cele ale 
coeficienţilor de echivalență, care sunt, de obicei, mai mari decât coeficienţii de stabilitate 
(Murphy, Davidshofer, 1987). Acest lucru se explică prin faptul că numărul factorilor care 
influenţează erorile ele măsură este mai mare în metoda test - retesl şi în metoda formelor paralele, 
decât în metoda analizei consistentei interne. De exemplu, acumularea de informaţii între test şi retest 
va afecta numai valoarea coeficienţilor de stabilitate, nu şi pe aceea a coeficienţilor de echivalență sau 
a coeficienţilor consistentei interne. 

Dacă, însă, persoanele examinate tin minte răspunsurile date la test şi le repetă la retest, se poate 
obţine un coeficient de stabilitate mare, chiar dacă testul are consistenţă internă scăzută. 
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6.5. FACTORI CARE INTERVIN ÎN ESTIMAREA COEFICIENŢILOR DE 
FIDELITATE 


Experimentele efectuate pentru determinarea valorii unui coeficient de fidelitate nu cuprind, în 
general, întreaga populaţie de persoane căreia îi este destinat testul, ci doar un eşantion din această 
populaţie. Din acest motiv, valoarea calculată este doar o aproximare(o estimare) a coeficientului 
de fidelitate. Selecţia unui alt lot va conduce la obţinerea unei alte valori. 

Pentru creşterea preciziei coeficientului de fidelitate, este necesar să fie îndeplinite următoarele 
condiţii (Traub, 1994): 

A. Eşantionul să fie cât mai voluminos. Deşi forma exactă a repartitiei coeficienţilor de 
fidelitate calculati pentru diverse eşantioane de acelaşi volum, extrase aleator din populaţie, nu este 
cunoscută, se obişnuieşte să se considere că abaterea standard a acestei repartitii (denumită eroare 
standard) este invers proporțională cu rădăcina pătrată din volumul eşantioanelor. Prin urmare, pentru 
a micşora de două ori eroarea standard este necesar să se mărească de patru ori volumul 
eşantionului. 

B. Eşantionul de subiecţi să fie reprezentativ pentru populaţia căreia îi este destinat testul. El 
trebuie să fie la fel de eterogen ca şi această populaţie, întrucât gradul de omogenitate al eşantionului 
are influenţă asupra mărimii coeficientului de fidelitate. 

C. Măsurătorile efectuate cu ajutorul testului să fie independente între ele. Măsurătoarea realizată 
asupra unui subiect să nu fie influenţată şi nici să nu influenţeze măsurătorile efectuate asupra altor persoane. 
Dacă administrarea testului se face în grup, acest lucru înseamnă că persoanele examinate vor fi 
supravegheate astfel încât nici una să nu poată copia. 

Atunci când calculul coeficientului de fidelitate impune ca fiecare persoană să răspundă de două ori la 
acelaşi test sau să răspundă la două forme paralele ale testului foarte asemănătoare între ele, cerința de 
independență a măsurătorilor se extinde, în sensul că măsurătorile efectuate asupra aceleiaşi 
persoane trebuie să fie independente între ele. Aceasta înseamnă că nu li se va oferi subiecţilor 
posibilitatea de a revedea sau de a-şi aminti răspunsurile date la prima administrare a testului. 

Dacă se calculează un coeficient de consistenţă internă, se- va urmări ca itemii testului să fie 
independenţi între ei. Prin urmare, rezolvarea unuia nu va fi condiționată de rezolvarea altuia şi nu vor 
exista itemi care să se refere la acelaşi aspect, astfel încât subiecţii să răspundă la ei în acelaşi mod 
(corect sau greşit). 

D. Procedura de administrare a testului şi a retestului sau a celor două forme paralele ale testului 
să fie identică şi, în acelaşi timp, să fie aceeaşi cu cea care se va utiliza în practică. Astfel, de exemplu, 
dacă se prevede ca testul să fie administrat cu limită de timp, în 40 de minute, atunci acest interval de 
timp va fi respectat şi la administrarea testului pentru estimarea fidelității. 


6.6. INTERPRETAREA COEFICIENŢILOR DE FIDELITATE 


Când avem de ales dintr-o mulţime de teste având toate celelalte caracteristici egale, este de 
preferat testul care are cea mai mare fidelitate. Dar, pe de o parte, testul cel mai fidel poate fi cel mai 
scump sau mai dificil de administrat. Pe de altă parte, caracteristicile testelor sunt rareori egale, 

Nu este posibil să se specifice un nivel minim care să fie impus coeficienţilor de fidelitate ai 
tuturor testelor. In practica obişnuită sunt utile următoarele recomandări: 

1. Se vor cere nivele înalte de fidelitate testelor folosite pentru a se lua decizii importante 
asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor diferenţe 
relativ mici între ei. In selecţia profesională, de pildă, se vor folosi teste care au coeficienţi de 
fidelitate mai mari decât 0.90 (J. C. Nunnally, după Hammond, 1995). 

2. Se vor accepta nivele scăzute de fidelitate atunci când testele se utilizează pentru a lua decizii 
preliminare, nu finale, şi în cazul testelor care împart persoanele într-un număr mic de categorii, 
pe baza unor diferenţe individuale mari. 

30 Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de fidelitate 
poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, însă testul se foloseşte pentru compararea 
persoanelor, una cu alta, coeficientul său de fidelitate trebuie să fie mai mare decât 0.85 (Aiken, 
1994). 

Fidelitatea chestionarelor de personalitate şi a celor de interese tinde să fie mai mică decât cea a 
testelor cognitive (de cunoştinţe, de inteligenţă, de aptitudini speciale, Aiken, 1994). 
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In general, se întâlnesc de obicei coeficienți de fidelitate cuprinşi între 0.70 şi 0.98 (Guilford, 
1965). 

Testele cotate obiectiv care măsoară aptitudini cognitive pot furniza, în loturi eterogene de 
persoane, coeficienţi de fidelitate mai mari decât 0.8. 

Testele cotate subiectiv care măsoară aptitudini, testele de cunoştinţe şi cele care evaluează 
performanţe tipice (de exemplu, chestionare de personalitate) au, adesea, coeficienți de fidelitate mai 
mici decât 0.80 (Traub, 1994). 

Testele standardizate de cunoştinţe au, în general, o fidelitate mare spre moderată. 

Testele cu alegere multiplă pot avea o fidelitate mai scăzută. Coeficientul lor de fidelitate este 
apropiat de 0.75. 

In practică se folosesc adesea teste care sunt valide pentru populaţia şi situaţia în care sunt 
administrate, dar care nu au coeficienţi de fidelitate foarte mari. 


Tipul de fidelitate necesar a fi calculat(Urbina, S., 2004), pe scurt: 

e Dacă scorarea testului implică judecăţi subiective atunci trebuie calculată fidelitatea 
interevaluatori, (sau testul trebuie să aibă un coeficient ridicat) 

e Daca un test va fi utilizat pentru a măsura schimbarea în timp, cum ar fi îmbunătățirile în urma 
unei intervenţii terapeutice, o estimare a erorii datorate eşantionării timpului este esenţială 

e Daca există posibilitatea ca o persoană să fie retestată ulterior, pentru a confirma rezultatele 
anterioare, atunci este necesară fidelitatea prin metoda testelor paralele 

e Dacă omogenitatea sau consistenţa internă a testului este necesară, atunci avem nevoie de 
coeficientul KR-20(Kuder- Richardson) sau Alpha Cronbach. 


Alte consideraţii despre fidelitate atunci când selectăm un test(Urbina, S., 2004): 

Pasul 1. Determinăm sursele potenţiale de eroare care pot afecta scorurile instrumentelor studiate 
Pasul 2. Examinăm datele despre fidelitate ale acestor instrumente, inclusiv tipurile de eşantioane pe 
care aceste date au fost obţinute 

Pasul 3. Evaluăm datele despre fidelitate în lumina celorlalte atribute ale testelor- cum ar fi datele 
despre norme şi validitate, constrângeri de timp şi costuri, etc. 

Pasul4. Când toate celelalte sunt egale selectăm testul care promite că furnizeză cele mai de încredere 
scoruri pentru scopurile testării şi pentru populaţia supusă testării(simultan) . 
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7. CARACTERISTICI METROLOGICE ALE TESTULUI: 
VALIDITATEA 


7.1. Definiţia validității 

7.2. Faţetele validității 

7.3. Eroarea standard a estimării 

7.4. Aspecte privind interpretarea validității 


7.1. DEFINIŢIA VALIDITATII SI PROBLEME ACTUALE LEGATE DE VALIDITATE 


Ca rezultat al evoluţiei psihometriei concepția ştiinţifică despre validitate a fost de mai multe ori 
redefinită. La începuturile psihometriei validitatea era considerată o caracteristică a testului, sau după 
primii ani de avânt, era trecută pe planul secund. Primele teste psihologice ajunseseră să fie văzute, 
oarecum într-un mod naiv, ca instrumente ştiinţifice care măsurau un lung şir de abilități mentale şi 
trăsături de personalitate, cam în acelaşi fel în care psihofizicienii măsurau răspunsurile auditive, 
vizuale, sau alte răspunsuri senzoriale şi perceptive la stimuli de tip sunete, lumină şi culori de diferite 
tipuri şi intensitati. 
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Mai apoi, succesul testelor Stanford-Binet şi Army Alpha în sprijinirea deciziilor practice despre 
indivizi, în educaţie şi angajări, a condus la o rapidă proliferare a testelor în primele două decenii ale 
secolului XX. Marea diversitate a aplicaţiilor pentru care aceste instrumente erau utilizate, foarte 
curând, a depăşit ca notorietate ratiunile ştiinţifice şi teoretice pentru ele, care erau disponibile la acea 
vreme. În scurt timp, multe teste psihologice au fost dezvoltate şi utilizate fără a beneficia de teoria 
psihometrică, principiile etice, şi ghidurile practice care au început să se acumuleze în ultimii zeci de 
ani ai secolului.(Urbina, S. 2004). 


Testele psihologice există pentru a ne ajuta să facem inferente despre persoane şi comportamentul lor. 
Principalul pericol potenţial la adresa unui test este lipsa de reprezentativitate a constructului testului şi 
variaţia sa, precum şi lipsa de corectitudine a inferentelor care se fac despre subiect pe baza scorurilor. 
Validitatea- de departe cea mai importantă problemă referitoare la scorurile testelor şi utilizările lor- 
depinde de dovezile pe care le putem aduce pentru a sprijini orice inferenta care se cere făcută pe baza 
rezultatelor la test. Primordialitatea consideratiilor de spre validitate este recunoscută în actualele 
standarde americane despre testare -Testing Standards(1999. AERA, APA, NCME)- prin plasarea sa 
ca subiect chiar la începutul acestora, în primul capitol. 


Astfel, în Testing Standards(1999) este definită ca : “gradul în care toate dovezile acumulate 
sprijină interpretarea dorită a scorurilor testului în raport cu scopul propus”. În această definiţie 
sunt, implicit, trei idei interconectate care reflectă viziunea actuală a psihometriei asupra acestui 
concept central şi multifatetat: 
1.  Validitatea scorurilor la teste provine din toate dovezile acumulate pentru a sprijini 
interpretarea şi utilizările lor. Astfel validitatea este întotdeauna o problemă de grad mai 
degrabă decât una de genul- “totul sau nimic”. Validarea — procesul prin care dovezile despre 
validitate sunt adunate- începe cu o afirmaţie explicită a dezvoltatorului testului despre 
cadrul conceptual şi rațiunea testului, dar este prin natura sa fără limită deoarece include 
toate informaţiile care se adaugă în timp la înţelegerea rezultatelor testării. 
2. Pe măsură ce se acumulează înţelegere teoretică şi dovezi empirice pentru interpretările 
scorurilor testului, validitatea inferentelor(a ipotezelor) făcute pe baza scorurilor pentru 
diverse scopuri propuse poate fi îmbunătăţită sau din contră- diminuată. Un corolar al 
acestei noțiuni explicit afirmat în standardele de testare(1999), este că: “validarea este 
responsabilitatea comună atât a dezvoltatorului testului(care furnizează dovezi şi explicaţii 
pentru scopul de utilizare a testului) cât şi a utilizatorului testului(care evaluează dovezile 
disponibile în contextul concret pentru care testul este destinat)”. 
3. Datorită multiplelor scopuri pentru care pot fi utilizate testele, bazele pentru 
interpretarea scorurilor testului pot fi derivate printr-o varietate de metode. Contribuțiile la 
dovezile despre validitate pot fi făcute prin orice tip de cercetare sistematică care sprijină sau 
adaugă ceva la semnificaţia lor, indiferent cine desfăşoară cercetarea sau când este făcută. 
Atât timp cât există dovezi ştiinţifice de încredere pentru o utilizare propusă a scorurilor 
testului, utilizatorii calificaţi de teste sunt liberi să folosească scorurile pentru scopurile lor, 
indiferent dacă acestea au fost prevăzute de dezvoltatori sau nu. Această afirmaţie ajută la 
explicarea multiplelor fațete ale cercetărilor de validare, tot aşa cum se întâmplă deseori să 
fie constatări redundante iar alteori contradictorii. De asemenea este o explicaţie pentru 
longevitatea anumitor instrumente, cum ar fi MMPI, scalele de inteligenţă Wechsler, pentru 
care o vastă literatură- rezultatul numeroaselor aplicaţii într-o mare varietate de contexte- a 
fost acumulată de-a lungul a multor ani de cercetare de bază şi aplicată. 


Din aceste explicaţii reiese că validitatea nu este o calitate a testului ci mai degrabă este o problemă 
de judecăţi care sunt direct relationate cu scorurile testului, în măsura în care acestea sunt o bază 
pentru un anume scop într-un context dat. Astfel procesul de validare este similar cu testarea 
ipotezelor : acesta subsumează semnificaţia scorurilor, fidelitatea scorurilor testului, la fel ca şi 
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modalitățile în care aplicaţiile informatiillor testului la cercetările psihologice şi practice pot fi 
justificate. 

Se poate afirma în acest moment că a existat o evoluție a viziunii despre validitate de la una clasică la 
una modernă. 

Validitatea testelor are patru fatete(Standardele APA, 1954), care au devenit patru stategii de validare 
a inferentelor făcute pe baza scorurilor la test(Standardele APA, 1985,1999): 


1. validitatea conceptuala 
2: validitatea de conţinut 
3. validitatea predictivă 
4. validiatea concurentă 


Principala evoluție priveşte punerea în legătură directă validității cu scorurile obținute la teste. 
Validitatea unui test, arată Silva, se referă la cât de potrivite sunt interpretările descriptive, 
explicative sau predictive care se dau scorurilor sale (Silva, 1993). Într-o acceptiune actuală, 
conceptului de validitate i s-a dat o semnificație noua. prin aceasta înțelegându-se „măsura în 
care o anumită inferenta făcută plecând de la test are înțeles si este potrivită" (APA Standards 
1985). 


Definiție: Validarea unui test este procesul prin care se investighează gradul de validitate a 
interpretării propuse de acesta (APA,1985). Iată, deci, că validarea nu se mai referă atât la 
instrumentul în sine, cât la interpretarea datelor furnizate de el. Dar, pentru o interpretare corectă a 
scorurilor unui test, este necesar să fie îndeplinite două condiții (Albu, 1995): 

e să se ştie exact ce reprezintă scorurile testului; 

e măsurările făcute de test să fie corecte. 


C. L. Lawshe propune înlocuirea denumirii de „tip de validitate" cu cea de „tip de analiză a 
validității". Prin „analiza validitatii"", el înţelege o procedură, un proces sau o strategie prin care se 
colectează sau se generează date în vederea determinării extinderii ori a robustetii inferentelor care pot 
fi făcute pe baza unei mulțimi de scoruri de test (1986). 

În linii generale, validitatea exprima gradul în care un test măsoară ceea ce îşi propune să măsoare. La 
această calitate se mai poate adăuga şi o alta, dacă testul poate fi utilizat în luarea unor decizii corecte. 
Cu alte cuvinte, daca noi cunoaştem performanţele unei persoane la un test (predictor), cât de precis 
vom putea estima ce performanţe profesionale va obţine? 

Rezultatul este cunoscut ca şi coeficient de validitate. Un test poate avea mai mulţi coeficienţi de 
validitate, în funcție de numărul de dimensiuni profesionale (calitatea muncii, disciplina, categoria 
profesionala etc.) care corelează cu el. 

Pentru a sublinia ideea că este greşit să se spună “testul are validitate de un anumit tip” încă din 1985, 
în Standardele APA se modifică terminologia utilizată în legătură cu validitatea, înlocuind denumirile 
cunoscute ale tipurilor de validitate cu formulări mai adecvate ştiinţific: * dovezi ale validității 
relative la — conţinut, construct, criteriu”. Coeficientul de validitate nu permite astfel să se afirme 
că testul are validitate relativă la criteriu ci constituie doar una dintre dovezile validității relative la 
criteriu. Din această perspectivă în cadrul acestei lucrări- utilizăm termenul de validitate predictiva, 
sau de construct(spre exemplu), ca abreviere convenţională “a dovezilor validității relative la 
criteriu(predictivă), sau relative la construct.” 

Este absolut necesar ca atunci când se vorbeşte despre dovezile validității testului să se indice despre 
ce fel de validitate se vorbeşte(la criteriu- predictivă/ concurentă, sau descriptivă- de conţinut / 
conceptuală).Dacă în cadrul unei populaţii există subgrupuri cu caracteristici diferite, este posibil ca 
între acestea să apară deosebiri şi în privinţa validității predictive a testelor. Spre exemplu, un test 
poate fi un bun predictor al performanţei numai pentru bărbaţi, nu şi pentru femei, sau numai pentru 
persoane care au studii superioare. O variabilă care modifică validitatea predictivă, cum sunt 
variabilele din exemplele anterioare(sexul şi studiile), se numeşte variabilă moderatoare. 
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Încă din 1974 şi până în prezent, în majoritatea lucrărilor de specialitate, se vorbeşte de trei fațete ale 
validității: 
e Relativă la construct 
e Relativă la conţinut 
e Relativă la criteriu(considerându-se că validitatea predictivă şi cea concurentă de referă 
la acelaşi lucru- diferenţa fiind doar de strategie) 


În paralel s-au facut nişte alegeri metodologice ca urmare a efortului de clarificare conceptuală a 
psihometriei. Una dintre temele consistente ale acestui efort a fost integrarea majorităţii formelor de 
dovezi ale validității, ca aspecte ale validității de construct (Guion, 1991; Messick, 1980, 
1988,1989; Tenopyr, 1986), ceea ce a dus la necesitatea reexaminării termenului de 
construct(recomandăm in acest sens lucrarea Urbinei S. 2004). 

Susana Urbina(2004) subliniază funcţia integrativă a constructului în validarea testelor, şi 
citează analiza făcută de Embretson în 1983. Constructul este utilizat în două ipostaze: ca trăsătură, 
proces, caracteristică a cărei prezenţă sau absenţă rezultatele testului o certifică şi ca inferenta ce poate 
fi făcută pe baza scorurilor testului. 

Embretson (1983)(apud Urbina, $.2004) a propus o separare între cele două aspecte ale cercetărilor de 
validare relativă la construct 

e O parte numită reprezentarea constuctului(construct representation) 

e O alta parte numită- anvergura, sau raza de acţiune nomotetica(nomotetic span) 


Potrivit autoarei menţionate cercetarea relativă la reprezentarea constructului este focalizată pe 
identificarea mecanismelor teoretice care subordonează performanţa în sarcină. Din perspectivă 
informaţională scopul reprezentării constructului este o descompunere a sarcinii. Aceasta poate fi 
aplicată unei varietăţi de sarcini cognitive, incluzând inferentele interpersonale şi judecatile sociale, şi 
presupune o examinare a răspunsurilor din punctul de vedere al proceselor, strategiilor, şi 
cunoştinţelor implicate în performanţă, deci este din punctul de vedere al executării sarcinii. 


Raza de acţiune nomotetică se ocupă cu reţeaua de relaţii a unui test cu alte măsurători. Se referă la 

tăria, frecvenţa şi patternuri de relații semnificative între scorurile la teste şi alte măsuri ale aceloraşi 

sau altor trăsături, între scorurile la test şi măsurile criteriului etc. 

Embretson (1983) descrie caracteristici suplimentare ale conceptelor de “reprezentare a 

constructului” şi “anvergură nomotetică” care ajută la clarificarea diferențelor dintre cele două 

aspecte ale cercetărilor de validare. 

Două sunt utile în contextul dovezilor referitoare la sursele dovezilor validității: 
e Cercetările despre reprezentarea constructului sunt preocupate primordial cu identificarea 
diferenţelor în sarcinile testului, în timp ce tipul complementar de cercetări, legate de anvergura 
nomotetică sunt preocupate cu diferenţele dintre examinati. Descompunerea unui proces poate să 
nu aibe legătură cu variabilitatea sa în populaţia de referință- deci testul are o bună reprezentare a 
constructului dar nu discriminează. lar deciziile asupra oamenilor se bazează pe variabilitate. 
e Validarea aspectelor de reprezentare a constructului este independentă de dovezile care sprijină 
anvergura nomotetică a scorurilor, şi invers. Putem şti precis ce procese sunt implicate în 
performanţă dar dacă nu sunt corelaţii semnificative cu comportamente sau măsuri din afara 
testului atunci scorurile testului pot avea o utilizare limitată.La fel, este posibil să obţinem o 
puternică reţea de relaţii între scoruri şi alte măsuri, fărăr a avea o definire clară a constructului 
pe care scorurile îl reprezintă. Exemplul dat de autoare aici este cel al testelor de inteligenţă, care 
au o mare anvergură nomotetică(corelează într-o măsură mai mare sau mai mică cu o varietate de 
alte măsuri), dar încă au o bază teoretică neclară(reprezentarea conceptului- de aceea Boring, în 
1923, afirma că inteligenţa este”ceea ce testele de inteligenţă măsoară”). 

Schema conceptuală trasată de Embretson reţine noţiunea de validare relativă la construct ca un 

mod unitar şi comprehensiv de a aborda ştiinţific integrarea tuturor dovezilor care privesc 
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semnificaţia şi interpretarea scorurilor la teste, şi, în acelaşi timp furnizează o bază pentru a 
distinge între: 
e Sursele de dovezi pentru validitatea scorurilor -care au legătură primordial cu a şti ce anume 
masuram(reprezentarea constructului) 
e Sursele de dovezi pentru validitatea scorurilor- care au legătură cu inferentele pe care le putem 
face pe baza a ceea ce măsurăm(anvergura nomotetică). 
Aceste surse ale dovezilor de validitate pot fi, deseori sunt, interrelationate şi ambele implică elemente 
teoretice şi observabile, ca şi modele sau postulate privind interrelatia dintre elemente. 


Includem pentru simplitatea ei o clasificare făcută anterior acestor dezbateri de către Guion 
(1976), care distinge numai două tipuri de validitati: 


° Validitati în raport cu criteriul(concurentă şi predictivă) prin care se stabileşte relația 
dintre scorurile la test şi cele de la criteriu (profesionale, şcolare etc.). 
° Validitati descriptive (de conținut şi conceptuală-de construct) care evaluează sensul 


intrinsec al scorurilor la test. 


După cum se vede în accepțiunea mai veche validitatea relativă la construct se referea doar la 
domeniul de conținut la testului- reprezentarea conceptului, cum spune Embretson. 


7.2 FATETELE VALIDITĂȚII: VALIDITATEA RELATIVĂ LA CRITERIU SI VALIDITATI 
DESCRIPTIVE- VALIDITATEA RELATIVĂ LA CONSTRUCT ŞI VALIDITATEA 
RELATIVĂ LA CONȚINUT 


În această lucrare am preferat prezentarea informaţiilor despre validitate în maniera clasică, viziunea 
celor trei tipuri mari de dovezi ale validității scorurilor. Deşi în practică validarea relativă la construct 
precedă relativă la conţinut şi criteriu, din motive legate de uşurinţa înţelegerii am preferat prezentarea 
lor în ordine inversă. 


Validitatea relativă la criteriu(validarea relativă la criteriu) 
Este gradul de încredere în inferentele pe care le facem privitor la o performanţă a subiectului, sau la 
un comportament prezis, pe baza scorurilor obţinute la test. 
Cu alte cuvinte, daca noi cunoaştem performanţele unei persoane la un test (predictor), cât de precis 
vom putea estima ce performanţe profesionale va obţine (denumită criteriu)? 
Aprecierea validității relative la criteriu se bazează pe valorile coeficientului de validitate al testului, 
ca şi coeficient de corelație între scorurile testului şi măsurătorile criteriului(ex. performanţa în 
muncă). 
Se poate ca variabila criteriu să fie un alt test psihologic, când se doreşte validarea unui dintre ele- şi 
atunci vorbim de validare concurentă. 
O aceeaşi variabilă poate juca rolul de predictor într-un caz(spre exemplu: performanţa şcolară — 
predictor pentru performanţa profesională), şi rolul de criteriu în alt caz(performanta şcolară prezisă de 
rezulatele unui test de inteligenţă). 
Procedee utilizate pentru validare: 

e Validarea predictiva 

° Validarea concurentă 

° Validarea prin grupele contrastante 


Validarea predictivă- este procedeul prin care se caută dovezi privind eficiența predictiei 
comportamentului unei persoane într-o situație data, pe baza scorurilor testului(eficienta măsurată 
după un timp mai lung sau mai scurt, dar nu în acelaşi timp sau imediat după testare). Spre exemplu în 
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selecția profesională- pentru estimarea validității predictive se calculează coeficientul de corelaţie 
liniară- r-intre scorurile testului şi măsurătorile performanţei profesionale după un anumit timp, 
suficient ca persoanele să înveţe profesia. Atunci când un test nu are dovezi privind validitatea 
predictivă deşi se poate aplica în selecţie rezultatul său nu poate fi luat în considerare, ci numai utilizat 
pentru calcului coeficientului de validitate. 

Validarea concurentă- este procedeul prin care se caută dovezi privind eficiența predictiei 
comportamentului unei persoane, utilizând în testare persoane cu vechime în munca respectivă, pentru 
care detinem evaluări ale performanţelor în momentul testării. Se numeşte concurentă deoarece se face 
în acelaşi timp cu testarea, odată ce dipunem de date privind performanta(este procesul invers-stim 
predicția posibilă şi observăm dacă scorurile testului ar fi confirmat-o). Se calculează tot coeficientul 
de corelaţie liniară între scorurile la test şi performanţele cunoscute în momentul testării. 

Deoarece validarea concurentă se face pe un eşantion de populaţie deja selectionat(personal deja 
angajat, sau studenţi deja admişi în facultate) apare un fenomen care influenţează coeficientul de 
validitate- fenomenul de restrângere a mulțimii, ceea ce presupune analiza atentă a semnificației 
rezultatelor obținute la test. 

Fenomenul restrângerii mulţimii 

Este un fenomen care trebuie luat în calcul în validarea concurentă, deoarece lotul pe care se validează 
testul nu este un lot care este supus selectiei(din care in mod firesc unii ar fi fost eliminaţi), ci este un 
lot deja selecționat, sau auto-selectionat. Spre exemplu într-un loc de muncă, pe parcursul a trei ani, au 
rămas numai cei satisfacuti, motivaţi şi care au performanţe cel putin satisfăcătoare. O parte din cei cu 
performanţe foarte bune şi potential de creştere au fost deja promovați. Dacă dorim sa validăm un test 
pe care să-l utilizăm pentru predictie, ne lipsesc rezultatele celor slabi şi ale celor promovați. Astfel 
coeficientul de corelaţie calculat are o altă valoare decât ar fi avut şi cu cei menţionaţi. În aceste 
condiţii se poate să obținem coeficienţi de corelație mai mici decât în realitate. 


Unii dintre specialişti în teoria testelor recomandă ca testele ce sunt utilizate in predictie să fie validate 
predictiv iar cele utilzate în diagnoză să fie validate concurent. 

Coeficientul de validitate al unui test este egal cu coeficientul de corelaţie liniară între predictor şi 
criteriu(în general). 

În literatura de specialitate există şi recomandarea de a calcula coeficientul de validitate folosind alti 
indici în locul coeficientului de corelaţie liniară. Anastasi(1976) propune ca atunci când testul şi 
criteriul sunt variabile continue să rămână coeficientul de corelaţie liniară, iar în celelalte cazuri să se 
folosească alte tipuri de coeficienţi. Cronbach(1966) permite calcularea cu ajutorul coeficientului de 
corelaţie a rangurilor; dacă regresia dintre test şi criteriu este o funcţie monotonă crescătoare, 
coeficientul de corelaţie a rangurilor are o valoare apropiată de 1, deci testul este valid în sensul lui 
Cronbach(în majoritatea cazurilor de selecţie profesională este vorba de comparatia a două 
clasamente, criteriul fiind rareori pe o scală de interval). Unii autori(Hammond, 1995) recomandă ca 
validarea unui test relativă la criteriu să utilizeze mai multe variabile criteriu, dintre care unele nu au 
legătură cu ceea ce prezice sau măsoară testul. Este de dorit ca testul să nu coreleze cu ele. 


Validarea prin compararea grupelor contrastante(putem spune că e o formă a strategiei de 
validare concurentă) 

Pe baza valorilor criteriului(ex. performanţa profesională) se formează două grupe — una cu persoane 
ce au rezultate foarte bune, cealaltă cu persoane ce au rezultate foarte slabe. Dacă în urma 
comparatiei statistice a mediilor rezultatelor obţinute la test se constată că acestea diferă 
semnificativ- se apreciază că testul este valid relativ la criteriu- şi are putere predictivă. Această 
metodă se aplică atunci când variabila — criteriu este calitativă, deci nu se poate calcula coeficientul de 
corelaţie liniară şi atunci când criteriul este compus din mai multe variabile- cantitative şi/ sau 
calitative. Este echivalent dacă afirmăm că pe baza rezultatelor testului putem diferenția între cei 
foarte slabi şi cei foarte buni. 

Problema criteriilor 
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Este una dintre problemele esenţiale ale validării. Printre cele mai cunoscute criterii ce sunt utilizate în 
practica psihodiagnostică sunt următoarele (Anastasi, A., 1988, 1996, apud Mitrofan, N. 2000): 

1) Achizitiile academice, evidenţiate prin note, medii, evidentieri speciale, rezultate la concursuri, 
promovări, graduări, recompense, burse etc., sunt foarte frecvent folosite pentru validarea testelor de 
inteligență. De aceea, mai mulţi autori au considerat aceste teste ca fiind modalități de măsurare a 
aptitudinilor şcolare. De asemenea, achizițiile academice sunt folosite şi pentru validarea testelor de 
măsurare a personalităţii şi a testelor pentru măsurarea aptitudinilor multiple; 

2) Performanţa în cadrul unui domeniu de formare specializat este folosită în calitate de criteriu pentru 
validarea unor teste folosite pentru măsurarea aptitudinilor speciale. Pot fi date ca exemple: - 
achiziţiile finale în cadrul cursurilor de formare profesională specială sunt folosite pentru validarea 
testelor ce măsoară aptitudinile tehnice; - performanţa în anumite ramuri artistice pot fi folosite în 
vederea validării testelor pentru măsurarea aptitudinilor artistice; 

3) Performanţa muncii (job performance) apare în calitate de criteriu folosit pentru validarea, în primul 
rând, a testelor pentru aptitudini speciale. Totodată, ea este utilizată, dar în mai mică măsură, pentru 
validarea testelor de inteligenţă generală şi a testelor de personalitate; 

4) Diagnoza psihiatrică este folosită în calitate de criteriu pentru evidenţierea validității testelor de 
personalitate, dacă este bazată pe observarea prelungită şi detaliată a cazului; 

5) Corelatiile dintre un test nou şi testele disponibile anterioare; de exemplu, validarea testelor de grup 
folosind bateria Stanford-Binet; 

6) Metoda grupurilor contrastante, ce implică un criteriu compozit, şi despre care am vorbit anterior. 
De exemplu, validitatea unor teste de aptitudini muzicale sau a unor teste de aptitudini tehnice pot fi 
verificate prin compararea scorurilor obţinute de studenţii admişi în instituţiile de artă sau de inginerie 
cu scorurile obţinute de cei respinşi la examenele de selecţie. 


Validitatea testului relativă la constructul măsurat(validarea relativă la construct) 


Două observaţii importante făcute de Standardele APA din 1985, şi menținute şi în cele din 1999 
relativ la ,,tipurile" de validitate: 

e prin „tipuri" de validitate nu se înţeleg „categorii disjuncte"; 

enu se poate afirma că un tip de validitate este mai potrivit decât altul pentru o anumită utilizare a 
testelor sau pentru o categorie specifică de inferente bazate pe scoruri. 


Prin intermediul testelor psihologice se măsoară atribute abstracte ca inteligența, motivaţia, 
agresivitatea, depresia etc, denumite constructe. Asemenea variabile sunt construite pornind de la fapte 
observabile, printr-un şir de raționamente bazate pe ipoteze şi deductii. Din acest motiv, validitatea 
relativă la construct este adesea denumită şi ,,validitate ipotetico-deductiva'' (Bacher, 1981). 
Toate constructele sunt însă conectate la realitate, reprezintă aspecte sau evenimente ale realităţi 
observabile. Constructele psihologice sunt evidenţiate, direct sau indirect, de comportament sau în 
urma conducerii unor experimente dedicate măsurării lor. 

Deoarece termenii construct şi concept sau noțiune sunt adesea utilizați ca sinonimi, validitatea 
relativă la construct a testului este denumită şi „validitate conceptuală". Intre cei doi termeni există 
însă o deosebire, evidenţiată de L. J. Cronhach: 

Constructul este ,,o categorie creată intenţionat pentru a organiza experiența in enunturi generale care 
se prezintă sub formă de legi" (Silva, 1993). Un construct este, deci, o noţiune elaborată şi utilizată 
într-un cadru ştiinţific (teoretic, metodologic sau aplicativ). 

Validarea testului relativă la constructul măsurat se ocupă de calitățile psihice care contribuie la 
formarea scorurilor acestuia şi urmăreşte înţelegerea dimensiunilor evaluate de test. Privind 
constructul ca baza interpretativă a răspunsurilor subiecţilor, acest tip de validare are şi scopul de a 
identifica şi analiza procesele psihice declanşate sau detectate de test (Silva, 1993). 

L. J. Cronbach, reluând ideea formulată de Standardele APA din 1954 conform căreia prin validarea 
testului relativă la constructul măsurat se validează atât testul, cât şi ipotezele aflate la baza sa, scrie: 
„» Validitatea testului şi validitatea constructului strict inseparabile. Când un test nou este elaborat 
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pentru măsurarea unui construct cunoscut, riscul ca validitatea să fie nesatislacătoare este mai mare 
pentru test decât pentru construct. Se poate constata şi necesitatea revizuirii constructului. Un exemplu 
în acest sens se constituie abandonarea ideii tradiționale asupra debilitatii mintale" (Silva, 1993). 
Numai înțelegând constructul măsurat de test se pot formula ipoteze asupra predictiilor pe care le face 
testul şi asupra relevantei şi a reprezentativitatii conţinutului său. 

Deci, în practică, validarea constructului trebuie să preceadă validarea conţinutului testului şi 
validarea relativă la criteriu. 


Procedură: Pentru a putea verifica dacă un test măsoară bine un anumit construct. este necesar să se 
realizeze o descriere a constructului în termeni comportamentali concreti. Operația se numeşte 
„explicarea constructului" şi constă din trei paşi (Murphy şi Davidshofer, 1991): 
1. Se identifica acele comportamente care au legătură cu constructul măsurat de test. 
2. Se identifică alte constructe şi pentru fiecare se decide dacă are sau nu legătură cu constructul 
măsurat de test. 
3. Se alcătuieşte câte o listă de comportamente prin care se manifestă aceste constructe. Pentru 
fiecare din ele, pe baza relaţiilor dintre constructe, se decide dacă are sau nu legătură cu constructul 
măsurat de test. 


Exemplu: Murpy si Davidshofer (1991) exemplifică procesul de descriere a constructului de 
„agresivitate la elevi" prin următorul exemplu: 


Construct e Comportament 


1. Identificarea comportamentelor referitoare la agresivitate 


agresivitate atacă alti elevi 
este capul rautatilor 
domină în jocuri 


2. Se identifică alte constructe şi se decide daca au sau nu legătură cuacest 
comportament 


trebuinta de putere ataca alti elevi 
agresivitate este capul rautatilor 
domină în jocuri 
onestitate 


3, Se identifică comportamentele aferente fiecărui construct şi sedetermină relaţia cu 
constructul care trebuie măsurat 


trebuinta de putere ia decizii în grup 
agresivitate atacă alti elevi 

este capul rautatilor 
domină în jocuri 

onestitate se abtine de la certuri 

spune adevarul profesorului 


Din analiza modelului de mai sus rezultă un sistem de relaţii care înglobează un set de constructe şi 
comportamente, denumit de L. J. Cronbach, „reţea nomologică" („„nomologică" în sensul că ea are la 
bază declaraţii exprimate sub formă de legi). Unii autori au folosit termenul de ,,stohastic", susținând 
că relaţiile dintre componentele reţelei sunt mai degrabă probabilistice decât de tip lege. 

Ideile referitoare la caracterul structural al constructelor şi la existenţa rețelelor nomologice au condus 
la descompunerea operaţiei de validare a testului relativă la constructul măsurat în trei componente: 


e validarea materialului testului (substantive validity), care necesită specificarea constructului 


70 


Bazele teoretice ale evaluarii psihologice- Rezumat 


măsurat de test şi se confundă uneori cu validarea conţinutului testului; 

e validarea structurii constructului aflat la baza testului (structural validity), care identifica 
elementele componente ale constructului şi investighează legăturile dintre ele; 

e validarea externă (external validity), care urmăreşte să determine relațiile constructului cu alte 
măsurători (constructe sau variabile observate). 


Validarea externă se referă la calitatea testului de a avea relaţii corecte cu alte măsuri 
psihologice; ea este denumită uneori „validitate convergentă şi discriminanta" (Murphy şi 
Davidshofer, 1991): 

a. Un test are validitate convergentă dacă măsoară ceea ce evaluează şi alte teste sau 
variabile care se referă la acelaşi construct, deci scorurile sale variază (liniar sau nu) în acelaşi sens cu 
rezultatele respectivelor măsurători. 

b. Un test are validitate discriminantă dacă evaluează altceva decât diverse teste sau 
variabile despre care se ştie că se referă la constructe ce nu au legătură cu constructul măsurat de test. 
Aceasta înseamnă că scorurile testului nu sunt în relație funcţională monotonă (liniară sau nu) cu 
rezultatele acelor măsurători. 


Procedură: Verificarea validității convergente şi discriminante se realizează conform următorului 
algoritm: 
e Se identifica acele comportamente care sunt legate de constructul măsurat de test. 
e Se determină constructele care au legături cu constructul măsurat ele test şi se pun în evidenţă 
acele comportamente legate de ele care pot fi conectate cu constructul măsurat de test. 
e Pentru toate comportamentele reţinute se apreciază ce fel de corelaţii ar putea exista între 
măsurile lor şi o măsură bună a construcţii lui care ne interesează (corelaţii pozitive, negative, 
mari, mici sau nule). 
e Se determină coeficienţii de corelaţie între scorurile la testul studiat şi rezultatele unor 
măsurători (eventual, scoruri de teste) efectuate asupra comportamentelor reţinute. 
e Se compară coeficienţii de corelaţie obţinuţi cu valorile aşteptate. 


Procedură: O metodă utilizată pentru verificarea validității convergente şi discriminante a testelor 
este aceea propusă de D. T. Campbell şi I). W. Fiske, bazată pe matricea multitrăsătură- 
multimetoda (multitrait-multimethod, Anastasi, 1976; Pitariu, 1994). Aceasta conţine valorile 
coeficienţilor de corelaţie liniară între diverse măsurători ale aceloraşi constructe, dar obţinute prin 
intermediul a două sau trei tehnici ori instrumente diferite. 

Exemplu: În urma evaluării constructelor a,b,c , despre care se face presupunerea că nu au legături 
între ele, prin trei metode diferite „test Z”, „test JI şi „test III, s-a obţinut următoarea matrice de 
coeficienţi de corelație liniară (pentru a se putea urmări mai uşor datele, ea a fost scrisă sub forma 
unui tabel unde coeficienţi de corelaţie sunt la pragul p = 0,05): 


Tabel privind matricea multitrăsătură- multimetodă, (Campbell şi Fiscke) 
Metode / test II test III 
constructe a b c a hk e 
81 
12 .86 
04 .32 .76 


46 
.14 .48 
08 .21 .55 
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.50 .85 


„32 .46 38 .83 
.28 .36 .60 $ .36 .40 .85 


Valorile notate pe diagonala principală sunt coeficienții de fidelitate ai testelor, obținuți prin 
metoda formelor paralele. De exemplu, pentru testul II, coeficienții de fidelitate sunt .74 (pentru 
constructul A), .77 (pentru constructul B) si .82 (pentru constructul C). Valorile de pe diagonalele 
celorlalte căsuțe sunt coeficienții de corelație între măsuralorile realizate de cele trei teste pentru 
aceleaşi constructe. Ei servesc la verificarea validității congruente. 

De exemplu, pentru constructul a, coeficienții de corelație sunt: 

* .46 (testul I cu testul ID; 

e .50 (testul I cu testul III); 

e 54 (testul II cu testul III). 

Pentru constructul b: 

* .48 pentru testul I cu IT 

* .46 pentru I cu III 

e .65 pentru Il cu III 

Pentru constructul c: 

e .55 pentru I cu H 

e .60 pentru I cu III 

e .61 pentru Il cu III 


Toti acesti coeficienti sunt semnificativi statistic la pragul p .05, ceea ce denota validitatea 
convergenta a celor trei teste. 

Celelalte valori din matrice reprezintă coeficienţii de corelaţie liniară între constructe diferite, 
măsurate prin acelaşi test sau prin teste diferite. Ei servesc la aprecierea validității discriminante a 
testelor. 

Se observă că testele I şi II discriminează între constructele A şi B (coeficienţii de corelaţie 
aflaţi sub diagonala casutelor I - I, I - H şi II - H sunt nesemnificativ la pragul p .05), în timp ce testul 
III nu are validitate discriminanta (coeficienţii de corelaţie liniară între constructele A, B şi C, 
măsurate prin testul III - în căsuţa III - III - sau prin testul III şi un alt test - în căsuţele IHI şi H - IH 
- sunt, în general, semnificativi la pragul p .05). 

In exemplul prezentat, validitatea convergentă şi discriminantă a testelor I, H şi III a fost uşor de 
dedus. Dar, în practică, apar situaţii complexe, când multi coeficienţi de corelaţie liniară pentru un 
acelaşi construct sunt nesemnificativi şi mulţi coeficienţi de corelaţie liniară între constructe diferite 
sunt semnificativi statistic. In asemenea cazuri este greu de apreciat care dintre teste este lipsit de 
validitate. 

Dacă testele măsoară constructe cu o structură complexă, pot să apară dificultăţi la interpretarea 
scorurilor. Din acest motiv, unii autori, ca M. L. Tenopyr, D. W. Fiske, J. C. Nunnally şi R. L. 
Durham, susţin că pentru a putea utiliza la interpretarea scorurilor unui test deductii bazate pe felul în 
care este construit testul, trebuie ca testul să se refere la constructe simple, bine definite şi cu 
manifestări uşor de observat (Silva, 1993). 


Procedură: O altă metodă de studiere a validității relative la construct implică manipularea 
experimentală a constructului măsurat de test (Murphy, 1987). De exemplu în cazul unui test 
destinat să măsoare anxietatea, se formează două grupe similare de subiecţi. În condiţii care nu 
generează anxietate cele două grupe vor realiza la test scoruri asemănătoare. Dacă, însă la 
administrarea unui grup 1 se spune ca va avea o surpriză neplăcută, iar celuilalt i se face instructajul 
obişnuit, este de aşteptat ca scorurile testului sa diferentieze semnificativ între grupe. Trebuie să se 
retina că validitatea relativă la construct a unui test nu poate fi exprimată printr-o mulțime de 
coeficienţi. Ea se deduce prin acumularea rezultatelor cercetării relative la ipotezele propuse(Silva, 
1993). 
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Validitatea unui test relativă la conţinutul său 


Se referă mai ales la categoria testelor de achiziție. Spunem că un test are validitate de conţinut, 
dacă el măsoară ceea ce şi-a propus să măsoare şi dacă elementele sale de conţinut (itemii) sunt 
expresia unui eşantion reprezentativ pentru un anumit univers de itemi sau univers de sarcini. 
Definiţie: Acest tip de validitate este analizat la testele care se utilizează pentru a estima "cum 
acţionează o persoană în universul de situaţii pe care testul intenționează să-l reprezinte”. 

Observaţii: În literatura psihologică există păreri diferite despre ceea ce se urmăreşte prin validarea 
testului relativă la conţinut. Anastasi(1976) consideră că acest tip de validare implică examinarea 
sistematică a conţinutului testului pentru a determina dacă el acoperă un eşantion reprezentativ din 
domeniul de comportamente pe care testul în cauză trebuie să-l măsoare. Dacă eşantionul este 
reprezentativ pentru populaţie, atunci se admite că testul are validitate relativă la continut(Gregory, 
1992). Alţi autori înlocuiesc expresia „domeniu de comportamente” cu „mulțimea sarcinilor”, sau 
„mulţimea performanţelor”. M.M. Linchan susţine că validitatea relativă la conţinut determină cat de 
bine reprezintă condiţiile în care este observat (prin test) comportamentul persoanei toate mulțimile de 
condiţii. R.T. Lennon consideră că, validitatea relativă la conţinut se referă la răspunsurile subiectului 
şi nu la întrebările testului. 

Pentru analizarea acestui tip de validitate trebuie luat în considerare nu numai conţinutul itemilor 
testului, ci şi procesul utilizat de subiect pentru a ajunge la formularea răspunsului(Silva, 1993). De 
exemplu, un test având drept domeniu de conţinut „cunoştinţele de ortografie”, format din itemi cu 
alegere multiplă, poate verifica dacă un individ recunoaşte cuvintele scrise corect din punct de vedere 
ortografic, dar nu şi dacă acesta ştie să scrie corect după dictare. Deci, nu este suficient să se spună că 
testul evaluează cunoştinţele de ortografie. În unele acceptiuni, validarea relativă la conţinut este o 
componentă a validării relative la construct. Ea se realizează după definirea constructului şi urmăreşte să 
verifice dacă eşantionul de stimuli şi cel de răspunsuri observate şi înregistrate în procesul de măsurare 
sunt reprezentative pentru universul de comportamente pe care îl defineşte constructul respectiv (M. M. 
Linehan, după Silva, 1993). 

Nu se poate afirma că, în privinţa atributului măsurat de test, un subiect care a realizat un scor mai 
mare îi este superior unuia care a obţinut un scor mai mic. Deci, operaţiile cuprinse sub denumirea de 
„validarea testului relativă la conţinutul său” nu reprezintă o validare, în sensul definiției date de 
Standardele APA din 1985. Ele realizează doar analiza testului în privinţa claritatii, a reprczentativitatii şi a 
relevantei conţinutului său. Ar putea fi privite ca o componentă a validării testului. 

Aurel Stan(2000, apud Mitrofan, N., 2000) menţionează că mai mulţi autori au propus diferiți 
indicatori de măsurare a validității de conţinut. Astfel, Lawshe a propus următoarea formulă pentru 
calcularea unui coeficient de validitate de conţinut, CVR (inițialele, in limba engleză, de la content 
validity ratio): 


CVR= 


Formulă în care Ne= numărul evaluatorilor (experților) care consideră testul, respectiv itemul, ca fiind 
reprezentativ; N = numărul total de evaluatori (experţi) 


Validitate de aspect(sau de faţadă) 

Acest tip de validitate nu este de fapt o măsură reală a validității, în sens tehnic (în Standardele 
APA nici nu o includ printre celelalte tipuri de validitate). Se referă la aprecierea pe care o fac cei care 
constituie obiectul testării cu o anumita probă, legat de adecvarea acesteia pentru categoria respectivă 
de subiecţi. 

L.Guttman şi S. Shye(Nevo, 1993, apud Albu, M., 1998) formulează o definiție operaţională a 
validității de aspect: “Se face o măsurare a validității de aspect atunci când o persoană testată/ un 
utilizator neprofesionist/un individ interesat, utilizând o tehnică absolută/ relativă, apreciază un item/ 
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un test/ o baterie de teste drept foarte potrivit/ potrivit, pînă la nepotrivit pentru utilizarea care îl 
interesează”. Aprecierea validității de aspect nu este realizată de experţi şi pentru măsurarea sa nu se 
folosesc metode psihometrice. Un inginer căruia într-un test de vocabular i se includ cuvinte ca 
“facsimil”, “unicorn”, ”sinapsa ” etc., poate judeca testul respectiv ca nepotrivit profesiei sale. Testul, 
spunem, în acest caz, nu are validitate de aspect. Validitatea de aspect este importantă pentru că 
asigură o atitudine pozitivă atât fata de test cât şi fata de examenul psihologic. Ea este legată mai mult 
de motivaţia celui testat decât de aptitudinea măsurată, şi astfel este inclusă ca parte componentă în 
performanţa generală la examenul psihologic. 
La estimarea validității de aspect contează în primul rând aprecierile subiecţilor şi în al doilea rând 
experţii participanţi la construcția testului. Validitatea de aspect nu face apel la metode psihometrice 
/statistice de calcul, ea se bazeaza pe impresii şi opinii, culese imediat după testare. 

Pentru psihologii antrenati în activităţi cu caracter aplicativ, construcția de teste şi validarea 
lor, reprezinta acţiuni de mare importanţă . În acest domeniu experienţa acumulata este mare, deşi încă 


nu s-a spus ultimul cuvânt. 


7.3. EROAREA STANDARD A ESTIMĂRII, SEE 
Formula de calcul utilizată pentru eroarea standard a estimării este: 


SEE = Sdy-rxy2 

în formulă: 

e Sdy - deviația standard la scorurile obţinute la criteriu; 

e rxy2, - pătratul valorii coeficientului de validitate; 

e dacă rxy = maxim 1, atunci SEE 0, deci o certitudine de 100% privind comportamentul 
subiectului în viitor; 

e dacă rxy = 0.80, atunci SEE = Sdy- 0.64 =0 .36, deci criteriul folosit de cei care au utilizat 
testul este bun, adică are putere de anticipare. 
De exemplu, dacă rxy = 0.80, SEE = 0.36, anticiparea poziţiei ocupate de subiect este mai precisă cu 
36%) decât dacă s-ar face din pură întâmplare. 
Formula SEE mai poate fi scrisă astfel: 


SEE= o-vl-r 
Unde o este abaterea standard a valorilor criteriului, r este coeficientul de corelaţie intre valorile 
predictorului şi valorile criteriului. 
Cu cât coeficientul de validitate al testului este mai mare cu atât eroarea standard a estimării este mai 
mica, iar predicția realizată cu ajutorul testului este mai precisă. 


În acest context se pune întrebarea :cât de mare poate fi valoarea coeficientului de validitate? 
Nu există un răspuns acceptat unanim de către autori. Desigur, ca o cerință generală, cu cât valoarea 
este mai mare cu atât mai valid este testul respectiv. Să nu uităm însă, că absolut întotdeauna valoarea 
coeficientului de validitate al unui test este mai mică decât valoarea coeficientului de fidelitate al 
aceluiaşi test. 
Unii autori (Anastasi, A., 1988, 1996) susţin că valoarea coeficientului validității trebuie să fie 
destul de mare pentru a fi statistic semnificativă la un nivel acceptabil, cum ar fi 0.01 sau 0.05. 
Alţi autori, cum este cazul lui M. Smith (apud Stan, A., 2002), propun o gradare a 
semnificatiilor unui indice de validitate: 
a) peste 0,50 - excelent; 
b) între 0,40 şi 0,49 - bun; 
c) între 0,30 şi 0,39 - acceptabil; 
d) sub 0,30 - slab. 
A. Stan atenționează însă că un coeficient de validitate mai mare de 0,70 este excepţional şi că el 
merită o examinare atentă când este raportat. 
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Hull(Guilford, 1965, Albu, M, 1998) a impus condiţia ca un test să fie utilizat în practică doar 
dacă are un coeficient de validitate mai mare decât 0,45, o cerinţă greu de realizat. Rareori un test bun 
poate avea o corelaţie mai mare de 0,5 cu un criteriu important(Murphy, Davidshofer, 1991). 

În experienţa obişnuită, valoarea coeficientului de validitate al testelor utilizate pentru a face 
predicții este cuprinsă între 0 şi 0,60, în majoritatea cazurilor între O şi 0,30. Constatarea că, în general, 
comportamentul aceleiasi persoane variază de la o situaţie la alta a condus la concluzia că valoarea 
coeficientului de validitate al testelor de personalitate administrate în scopul predictiei unei acţiuni nu 
poate fi mai mare decât 0,4(Funder, 1983, Albu, M., 1998) 


7.4. ASPECTE PRIVIND INTERPRETAREA VALIDITATII 


Din practică a reieşit observaţia că un test ideal din punct de vedere al validității este cel ai cărui itemi 
măsoară fiecare un alt factor; deci un test cu consistenţă internă scăzută, în mod paradoxal, aceasta 
însemnând o fidelitate mică. Coeficientul de validitate al oricărui test nu poate depăşi coeficientul de 
fidelitate al acestuia. Astfel, dacă un test nu este fidel, validitatea sa relativ la orice criteriu nu poate fi 
mare. Cu toate acestea, o valoare mare a coeficientului de fidelitate nu garantează o validitate mare. 
La fel ca şi în cazul fidelității, o serie de factori afectează si validitatea unui test. Amintim câţiva 
dintre acestia(Albu, M., 1998): 
a. Unele caracteristici ale populaţiei testate: 

e Sexul 

e Vârsta 

e Pregătirea profesională 

e Anumite trasături de personalitate 


Acestea acţionează ca variabile moderatoare, modificând relaţia dintre criteriu şi predictor. Subiectii se 
împart în grupe, în funcție de valorile variabilei moderatoare, iar valoarea coeficientului de validitate 
se poate schimba de la o grupă la alta. În general coeficienţii de validitate sunt mai mici în grupele mai 
omogene, adică în grupele în care scorurile testului sau valorile criteriului variază puţin. Atunci când 
valoarea coeficientului de validitate este scăzută, iar ceea ce se cunoaşte despre test şi despre criteriu 
nu oferă o explicaţie, trebuie să se verifice dacă nu există o variabilă moderatoare care se interpune 
între criteriu şi test. Deoarece validitatea unui test este dependentă şi de grupul de subiecţi, atunci 
când se constată că un test nou este valid fata de un anumit criteriu, este necesar să se efectueze o 
validare suplimentara(cross-validation), folosind acelaşi criteriu, dar un alt eşantion de subiecţi, 
proveniţi din aceeaşi populaţie ca şi primul. Dacă şi în acest caz apar dovezi ale validității atunci se 
poate recomanda utilizarea sa în practică. 

b. Validitatea relativă la criteriu este influenţată de lungimea testului. Prin adăugarea de itemi 
paraleli la test validitatea testului creşte. 

c. Validitatea testului este dependentă şi de validitatea criteriului, ca măsură a variabilei la care se 
referă testul. Dacă valorile criteriului sunt influențate de scorurile testului se spune că a avut 
loc o contaminare a criteriului, ceea ce duce la creşterea artificială a validității relative la 
criteriu a testului. Contaminarea criteriului se produce atunci când testul şi criteriul au itemi 
comuni sau în acele situaţii când valorile criteriului sunt rezultatul unor evaluări făcute de 
experţi, iar aceştia cunosc scorurile obţinute de subiecți la test şi, intenţionat sau nu, sunt 
influenţaţi de ele în formularea aprecierilor. 

d. Mărimea coeficientului de validitate este influenţată şi de frecvenţa relativă în populație a 
persoanelor care reprezintă caracteristica la care se referă testul.Atunci când comportamentul 
pe care îl măsoară sau îl prezice este foarte rar întâlnit(exemplu psihotismul sau suicidul), 
validitatea relativă la criteriu este de obicei scăzută. 

e. Uneori criteriul utilizat duce la un coeficient de validitate scăzut: 

e Cand criteriul are o fidelitate scăzută 
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e Intervalul de valori pentru criteriu este restrâns, neacoperind decât o parte din mulțimea 
valorilor posibile 

e Distribuţia valorilor criteriului nu este normală 

e Valorile criteriului nu sunt acordate sau notate corect, din cauza unor factori ce ţin de 
evaluatori(oboseală, neatentie, incompetenta sau părtinire), sau de dificultatea de 
măsurare a criteriului respectiv. 


Aspecte importante la validarea unui test şi la interpretarea coeficienţilor de validitate 


a. 


Validitatea unui test este dependentă de scopul pentru care acesta este folosit şi de 
populaţia căreia i se administrează testul. Un test nu este valid în orice situaţie de 
utilizare. 
Există diverse metode pentru validarea testelor: analiza de itemi, calculul 
coeficienţilor de corelaţie predictor- criteriu, analiza factorială etc. Alegerea 
strategiei de validare trebuie să fie determinată de scopul pentru care se va utiliza 
testul şi de cerinţele formulate de cel care a solicitat examinarea psihologică. 
Validitatea nu poate fi estimată dintr-un singur coeficient, ci se deduce din 
acumularea dovezilor empirice şi conceptuale. Acesta este motivul pentru care, 
începând cu Standardele americane din 1985, se recomandă utilizarea formulării : 
“dovezi ale validității relative la...” construct, criteriu, conţinut, în loc de 
“validitate relativă la ...”. 
Strategiile de validare se aplică încă din faza de construcţie a testului, şi se repetă 
până când se obține un test acceptabil în ceea ce priveşte lungimea, fidelitatea, 
validitatea şi uşurinţa de administrare, cotare şi interpretare. Procedeele de 
validare sunt următoarele: 
= Pentru testele ce măsoară constructe- se introduc în test două categorii de 
itemi, unii reprezentativi pentru construct, şi unii despre care se presupune 
ca nu au nici o legătură cu constructul. Sunt reţinuţi în final doar acei itemi 
care se aseamănă între ei în privinţa răspunsurilor obţinute de la subiecți, 
se analizează conţinutul pentru a vedea dacă exemplifică teoria 
constructuluice trebuie măsurat şi dacă se deosebesc de itemii consideraţi 
nerelevanti pentru construct. 
= Pentru testele ce vor fi validate doar relativ la conţinutul lor- se introduc 
doar itemi ce acopera domeniul de continut al testului. Dupa administrare 
se retin doar itemii la care s-au obţinut răspunsuri asemănătoare. Se 
verifică dacă ei corelează cu un criteriu care se referă la acelaşi domeniu 
de conţinut, sau dacă răspunsurile obținute la aceşti itemi se deosebesc 
semnificativ între două grupe constrastante de subiecţi. 
= Pentru testele utilizate în predicții sau în decizii, pentru care se poate alege 
un criteriu de validare, după administrare se retin itemii care se comportă 
fata de criteriu aşa cum se doreşte să se comporte întregul test. 
Validarea unui test se repetă mereu pe parcursul perioadei în care acesta este 
utilizat pentru îmbunătăţirea şi rafinarea interpretărilor scorurilor testului. La fel 
se procedează de fiecare dată când se fac modificări în orice aspect al testului sau 
al testării. 
O serie de cercetători precum S. Messick(Foundations of validity; meaning and 
consequences in psychological assessment, apud Minulescu, M., 2003), susțin că 
ceea ce trebuie validat nu este numai testul sau instrumentul de observare ca atare, 
ci inferentele derivate din scorurile la test. Aceste inferente privesc înţelesul 
scorurilor sau interpretării şi implicaţiile practice ce vor urma acestor interpretări. 
Astfel privită- validitatea se redefineşte ca: “o evaluare empirică a intelesului şi 
consecinţelor măsurătorii efectuate. Validitatea combină cercetarea ştiinţifică cu 
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argumentul rational(teoretic) pentru a justifica sau anula interpretarea unui test şi 
utilizarea lui.” 

g. Fundamentul pentru consecinţele interpretării testului îl reprezintă evaluarea 
implicatiilor intelesurilor scorului, incluzând uneori implicarea denumirii 
constructului, teoriei lărgite care conceptualizează proprietățile constructului şi 
ramificatiile relationale ale intelesului constructului şi ideologia mai larga care dă 
teoriei scop si perspectivă(de exemplu ideologia referitoare la natura umană ca 
învăţare, adaptare etc.) 

h. Deseori denumirea constructului relevă atitudinea latentă a cercetătorului fata de 
importanţa acesteia, atitudine care este mai degrabă dependentă de ideologie decât 
de dovezile experimentale. 

i.  Validitatea de construct este acea forță integrativă care uneşte problemele 
validității într-un concept unitar. 
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8. CONSTRUIREA SI EXPERIMENTAREA TESTELOR 


8.1.Cerinţe: paşii standard în construirea unui test psihologic 
8.2.Analiza de item 


8.1. CERINŢE: PAȘII STANDARD ÎN CONSTRUIREA UNUI TEST PSIHOLOGIC 
(Minulescu, M., 2003) 


e Stabilirea unei necesităţi: luarea în considerare a cerinţelor formale şi informale pentru test. 
Trebuie să realizăm un fel de anchetă socială pentru a vedea dacă această necesitate este reală sau ţine 
de imaginarul nostru. Trebuie să scanăm disponibilitatea pieţei, să vedem dacă există ceva similar 
(pentru a nu repeta). 

* Definirea obiectivelor si parametrilor testelor: stabilim scopul testului (cine este testat şi de 
ce a fost ales acest test), clarificăm modul în care informaţia utilizată de test va fi utilă şi celui care dă 
testul şi beneficiarului. Trebuie să luăm în considerare tipul de format al itemilor şi tipul de format al 
răspunsurilor, dar şi numărul de itenii ce vor fi incluşi. 

e Selectarea unui grup de experţi în domeniul respectiv: se discută din nou obiectivele, 
scopurile şi parametrii testului şi se determină o primă machetă a testului. 

e Scrierea itemilor(crearea băncii de itemi): se utilizează experţi din domeniul testului sau 
specialişti din aria domeniului respectiv pentru a scrie itemii. După ce au fost sorişi, itemii trebuie să 
fie revizuiti (din punctul de vedere al conţinutului) de către cel putin o persoană sau de către o echipă 
care nu a fost implicată în scrierea lor. 

e Faza de teren. ltemii sunt supuşi probei realităţii. Un prim eşantion de itemi este utilizat 
pentru a fi testati subiecţi reali, dintr-un anumit grup ţintă (grup realizat în funcție de vârstă, sex, 
pregătire profesională etc.)- In urma testării, se va calcula gradul de dificultate şi de discriminare al 
itemilor (aceasta reprezintă analiza de itemi). 

e Revizuirea itemilor, care se produce în urma analizei de itemi. Se verifică dacă există o 
anumită încărcătură nedorită de itemi sau prejudecăţi (de exemplu, sexuale sau legate de minorităţi). 
Sunt eliminaţi itemii care pot să fie incorecti, nedrepti sau pot să lezeze anumite grupuri de indivizi. 

e Alcătuirea formei finale a testului. Se verifică adecvarea grilei de scorare, mergându-se până 
la subtilitati în ceea ce priveşte scorarea răspunsurilor. Se întâmplă foarte multe accidente în faza 
finală, astfel că este necesară intervenţia unui „cap limpede" (cineva care este scos din paşii 
experimentării şi care verifică tot, inclusiv forma finală; de obicei, este cineva din afară). Se reverifică 
itemii Şi grila de scorare. 

e Constituirea normelor şi calcularea finalitatii şi validității: 

1. Datele tehnice ale testului sunt verificate. Se fac procedurile de eşantionare sau de constituire a 
loturilor de experimentare. 

2. Administrarea şi scorarea formei finale a testului. 

3. Se calculează finalitatea si itemii de finalitate. 

4. Construirea normelor adecvate de interpretare. 


A 8.1.2. METODE DE CONSTRUIRE A TESTELOR 
In majoritatea lucrărilor de teoria testelor psihologice, metodele de construire a testelor psihologice 
sunt împărțite în trei categorii(Burisch, 1986; Van Der Maesen, Hofstee, 1989; Albu M., 1998): 

1. Metodele deductive- denumite şi rationale, sau bazate pe simţul comun 

2. Metodele inductive sau interne 

3. Metodele externe sau empirice 


1. Metodele deductive, denumite şi raţionale sau bazate pe simţul comun, sunt cele în care 
construirea itemilor şi selectarea celor care vor compune testul se bazează exclusiv pe părerile 
unor persoane (experți sau nu). Mai întâi sunt alese constructele care vor fi măsurate de teste, 
apoi sunt elaborati itemii, care realizează o definire implicită sau explicită a constructelor, 
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singurul ghid în această operaţie fiind intuiţia autorilor itemilor. 
Din această categorie fac parte: 
* metoda prototipului; 
“metoda BARS(behavioral anchored rating scales); 
* metoda ordonării comportamentelor de către experți; 
* metoda designului cu fațete; 
* metoda intervalelor aparent egale. 


2. Metodele inductive sau interne pornesc de la o colecţie mare, eterogenă, de itemi (de obicei 
extraşi din teste aflate în circulație), considerată a fi reprezentativă pentru constructele care 
trebuiesc măsurate. Prin procedee statistice, cum sunt analiza factorială şi analiza de clusteri, se 
urmăreşte să se depisteze grupările de itemi care corespund constructelor respective. 

Din această categorie de metode fac parte: 

* metoda consistentei interne; 
“metoda teoretică; 
* metoda analizei criteriului intern. 


3. Metodele externe sau empirice necesită precizarea, de la început, a relaţiilor care vor trebui să 
existe între scorurile testului care va fi construit şi diverse criterii externe. Se porneşte de la o 
colecție mare, eterogenă, de itemi, se compară scorurile acestora cu criteriile şi se retin cei care 
au comportarea pe care trebuie să o aibă întregul test. 

Din această categorie de metode fac parte: 

“metoda criteriului extern; 

* metoda analizei constructului. 
După cum se observă, metodele deductive nu necesită nici experimentarea itemilor, nici efectuarea 
unor analize statistice, în timp ce metodele inductive şi cele externe se bazează pe prelucrarea 
statistică a rezultatelor experimentării itemilor, acordând o pondere redusă modului de construire a 
itemilor. În multe situaţii este posibilă - şi chiar recomandabilă - construirea testelor cu ajutorul mai 
multor metode: o metodă deductivă va servi la formarea băncii de itemi, iar printr-o metodă internă 
sau/şi una externă se vor selecta itemii care vor alcătui testul. 


8.2. ANALIZA DE ITEM 


8.2.1. ANALIZA GRADULUI DE DIFICULTATE ŞI A CAPACITĂȚII DE 
DISCRIMINARE A ITEMULUI 


Analiza de itemi are ca obiectiv de bază descifrarea mecanismelor cognitive aplicate de subiecți 
pentru formularea răspunsurilor la itemi şi verificarea calităților itemilor ca instrumente de măsură sau 
de predictie. Pe baza analizei de itemi se obţin informaţiile care permit selectarea itemilor care intra în 
componenţa testului. 

Itemii pot fi analizati dintr-o dublă perspectivă - cantitativă şi calitativă. 

Analiza cantitativă se referă la proprietăţile statistice ale itemilor şi este focalizată în principal 
pe clarificarea problemelor privind dificultatea şi capacitatea de discriminare a itemilor. 

Analiza calitativă se referă în principal la aspecte de conţinut şi de formă incluzând problema 
evaluării eficienţei procedurilor de redactare şi a validării de conţinut. 

Analiza itemilor poate fi rezumată prin următorul algoritm: 

1) calculul indicelui de dificultate pentru toţi itemi şi eliminarea celor care sunt rezolvati de toți 
subiecţii şi celor nerezolvati de nici un subiect; 

2) depistarea cauzelor pentru care unii indici de dificultate sunt foarte mari sau foarte mici şi 
eliminarea itemilor cu greşeli; 

3) în situaţia itemilor cu răspunsuri la alegere, se analizează răspunsurile incorecte şi se elimină aceia 
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în care unele răspunsuri greşite au fost alese de foarte multi sau foarte puţini subiecţi; 
aplicarea uneia dintre procedurile analizei de itemi şi selecţia itemilor, în funcție de condiţiile pe 
care trebuie să le îndeplinească testul ce se construieşte, respectiv: 

a. dacă testul trebuie să discrimineze între două grupe contrastante, respectiv să permită 
scoruri care diferă mult de la o grupă la opusul ei, se va calcula pentru fiecare item 
indicele de discriminare, eliminându-se itemii necorespunzători; 

b. dacă testul trebuie să se comporte într-o manieră prestabilită faţă de un anume criteriu, 
se vor elimina itemii necorespunzători; 

1. se vor elimina itemii cu indicele de dificultate necorespunzător scopului pe care 
urmează să-l îndeplinească testul. In principiu se vor elimina cei foarte uşori şi 
foarte dificili. Dacă cerința este ca lestul să identifice pe cei care prezintă 
nivele foarte scăzute şi foarte ridicate pentru o anume trăsătură sau facultate, se 
vor reţine doar aceste tipuri de itemi; 

li. se va calcula coeficientul de corelație între scorurile testului şi scorurile 
itemului şi se vor elimina itemii care prezintă corelaţii nesemnificative sau 
negative. 

In continuarea construirii testului pe baza itemilor astfel selectaţi se procedează la studierea 
caracteristicilor psihometrice (fidelitate, validitate, dificultate, putere de discriminare), aspectele 
legate de lungimea testului, tipuri de itemi din care este compus, timpul de rezolvare a testului 
(inclusiv variante privind standardizarea timpului), costurile administrării testului. 


Dificultatea itemului 
In majoritatea situaţiilor cerute de scopul testării, dificultatea itemului e definită în funcţie de 


procentul de persoane care răspunde corect la el. In procesul de construire a unui test, motivul 
principal al analizei dificultății itemilor este de a alege itemi care au un procent de dificultate adecvat, 
în aşa fel încât testul să nu constituie nici o dificultate de netrecut pentru majoritatea subiecţilor, nici 
să nu fie rezolvabil de marea lor majoritate. 


Pentru diferite loturi de subiecţi, cu caracteristici diferite privind, de exemplu, vârsta, nivelul de 
pregătire academică, tipul de pregătire, mediul de provenienţă etc, aceiaşi itemi pot conduce la 
diferite procente sau ponderi de subiecţi care răspund corect. 

Majoritatea testelor sunt construite cu itemi având grade de dificultate diferite astfel se pune 

de dificultate. 

Nivelul de dificultate recomandabil este .50 (50% reuşită). Cu cât un item se apropie de 0% sau de 

100%, cu atât este ineficient în diferenţierea subiecților. Itemul trebuie să fie capabil să 

diferentieze între toţi cei care îl reuşesc şi cei care nu îl reuşesc pentru a avea valoare de informatie 

diferențială. 

De exemplu, pentru gradul de dificultate de 0.5 (50%): Să presupunem că din 100 de persoane, 
50 reuşesc şi 50 nu reuşesc să rezolve itemul. Deci, itemul ne va da posibilitatea să diferentiem 
între fiecare dintre cei care l-au reuşit şi fiecare dintre cei care au eşuat. Deci, avem astfel 50 x 
50 = 2.500 perechi de comparaţie, sau biti de informatie diferențială. Un item reuşit de .70 
(70%) va favoriza 70 x 30 = 2.100 biti informationali. Unul reuşit de .9 (90%) furnizează, deci, 
90 x 10 = 900, iar cel reuşit de 100%, 100 x 0 = 0. Acelaşi lucru este valabil şi pentru itemi 
mai dificili, pe care îi reuşesc sub 50% dintre subiecţi. 

e Jtemii din cadrul unui test tind să intercoreleze. Cu cat este mai omogen testul, cu atât gradul 
de intercorelare este mai mare. In situaţia extremă în care toți itemii ar fi perfect intercorelati şi 
toți ar avea gradul de dificultate .50, aceleaşi 50 de persoane din 100 vor rezolva fiecare dintre 
itemi. Deci, jumătate dintre subiecţi vor avea scoruri perfecte, iar cealaltă jumătate vor avea un 
rezultat nul. Deci, datorită intercorelării dintre itemii testului cel mai bine este să fie selectaţi 
itemi cu nivele de dificultate diferite a căror medie a dificultății să fie .50. Cu cât e mai mare 
nivelul de intercorelare dintre itemi, cu atât mai largă trebuie să fie gama de grade de 
dificultate a itemilor selectaţi. 

e In cazul scalelor de interval, procentul de persoane care reuşeşte un item exprimă dificultatea 
itemilor la nivelul scalei ordinale, ceea ce înseamnă că exprimă corect rangul şi dificultatea 
relativă a itemilor. De exemplu, dacă avem 3 itemi care sunt rezolvati, respectiv de 30%, 20% şi 
10% dintre subiecţii lotului, putem conchide că primul item este cel mai uşor, iar itemul al treilea, 
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cel mai dificil, gradul de dificultate crescând de la primul la al treilea. Dar, pentru diferenţe de 
procentaje egale, nu putem aprecia dacă există şi diferenţe egale în gradul de dificultate între cei 
trei itemi. Acest lucru ar fi posibil doar în cazul unei distribuții rectangulare, unde cazurile ar fi 
uniform distribuite pe tot şirul. Scorurile de tip percentil nu reprezintă unităţi egale, ele diferă în 
mărime de la centru la extremele distribuţiei. 

Dacă avem o distribuţie normală a rezultatelor pentru trăsătura respectivă, nivelul de dificultate al 
itemului poate fi exprimat în termenii unei scale unități de interval egale comparativ cu tabelul de 
frecvenţe al curbei normale. In acest caz, avem informaţia că 34% din populaţie intră în zona 
cuprinsă între medie şi - sau + 1 sigma(o ). 

Astfel, un item care are nivelul de dificultate .84 (rezolvat de 80% dintre subiecţi) va include 
jumătatea superioară (50%) plus 30% din cazuri din jumătatea inferioară (50 +30 = 80). Deci, 
itemul cade 1 sigma sub medie. Un item reuşit de 16% dintre subiecţi va cădea la o sigma peste 
medie (peste acest punct se află 16% dintre cazuri, respectiv 50 - 34 (o sigma) =16. Un item reuşit 
de exact 50% dintre subiecţi cade pe medie şi va avea valoarea 0 pe această scală. 


In practică, datorită faptului că dificultățile itemilor exprimate în termenii distanțelor pentru o 
curbă normală include valori pozitive şi negative, Serviciul american de testare educaţională a 
propus următoarea ecuaţie de convertire: 


A (delta) = 13 + 4z 
Constantele 13 şi 4 au fost alese arbitrar pentru a permite o scală care să elimine valorile negative. Z 
indică numărul de deviații standard(abateri standard) de la medie (sigma). 
De exemplu, un item reuşit de aproximativ 100% subiecţi va cădea la o distanţă de 3 sigme de medie, 
deci va avea D = 13 + 4x (-3)= 1. 
La cealaltă extremă, un item cu un procent de reuşită sub 1 va cădea la + 3 sigme şi va avea D = 13 + 
4x (3) = 25. Un item care cade pe medie are D = 13 + 4x (0) =13. Deci toți item ii vor cădea la scale 
D între 1 şi 25, iar dificultatea medie va fi redată prin nivelul 13. 


Analiza capacităţii de discriminare a itemilor 
Discriminarea itemilor se referă la gradul în care un item diferenţiază corect intresubiecti în ceea 
ce priveşte comportamentul destinat să-l măsoare. în literatura de specialitate apar peste 50 de 
indicatori de discriminare care pot fi utilizaţi în construirea diferitelor tipuri de teste, indicatori 
care, de regulă, oferă rezultate relativ asemănătoare. 
O metodă utilă pentru grupe în general mici cuprinde următoarea procedură: 
Sunt pretestati subiecţii unui lot restrâns (ex. 60 de persoane). 
în funcție de rezultate, subiecţii sunt grupaţi în trei clase. 20 cu scorurile cele mai înalte (clasa de 
us, ,,U" de la upper), 20 cu scorurile cele mai scăzute (clasa de jos, ,,L" de la lower), şi 20 cu 
scoruri intermediare (clasa medie, „M", de la middle). 
Pe cele 3 clase se vor verifica itemii testului astfel: 


Tabelul ni: I 


AL L| Dificultatea | Discriminarea- 
|| | ML 


Elks eae ee 
ao a 
(19| 18| 9| 46 | 10 | 
| 4 | tol ulis) 37 | -6 | 
5 | | 3} i} 35s | o | 
| 6 | tol i| o| 3 | 7 | 
95| OG! 


ol os | 5 II 
ete. | | | | ft 


Dificultatea itemului reprezintă suma de reuşite la cele trei clase de subiecţi, iar discriminarea 


este dată de diferenţa dintre grupele extreme. 


In aceste condiţii, putem vedea că există 4 itemi care prezintă probleme (*) fie din perspectiva 


dificultății, itemii 2 şi 7, fie a discriminării, itemii 4 şi 5. Dacă itemul 2 are o dificultate prea mică, 7 
este prea dificil, deci trebuie excluşi. Itemii 4 şi 5 au discriminare fie negativă, fie nulă, deci vor fi 
excluşi. De regulă, în situaţia claselor de subiecţi care au aceeaşi dimensiune, itemii cu valoare de 
discriminare scăzută sunt cei de la 3 puncte în jos. 
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Indexul de discriminare 


Când exprimăm în procente numărul de subiecți care reuşesc la itemii cuprinşi într-un nou test, o 
diferență de 2% reprezintă indexul de discriminare, indiferent de dimensiunea grupelor. Acest index 
de discriminare este denumit Upper-lower discrimination, prescurtat ca ,,U-L", ,,ULI", sau ,,;ULD" 
sau pur si simplu ,,D". 


De exemplu, calcul D pornind de la datele anterioare se prezintă astfel: 
Tabelul nr. 2 


Index de discriminare 
| | Clasa U| ClasaL | diferenta 


D poate avea o valoare cuprinsă între +100 şi - 100. 

Dacă toţi subiecţii clasei U reuşesc la item şi nici unul dintre subiecţii clasei L nu reuşeşte, D = 
100. Dacă nici un subiect din U nu reuşeşte şi toţi cei din L reuşesc, avem valoarea lui D = 0. 

Pentru unii dintre indicii de discriminare, valorile lui D nu sunt independente de dificultatea 
itemului, dar sunt influențate în direcţia nivelului de dificultate intermediară. 

Tabelul nr.3 indică maximul posibil al valorii lui „D" în funcție de diferite procente de răspunsuri 
corecte. Dacă fie 100% fie 0% din lot reuşesc la un item, nu apare nici o diferenţă între clasele de 
subiecţi, deci ,,D" este 0. Dacă 50% reuşesc un item, este posibil ca toţi cei din clasa „U să-l treacă, şi 
nimeni din clasa ,,L, iar ,,D" va fi 100 - 0 == 100. Dacă 70% reuşesc, maximul valorii pe care o poate 
lua ,,D" va fi 60 pentru că „U" 50/50= 100% şi ,,L" 20/50 = 40%. ,,D" va fi 100 - 40 = 60. 

Pentru majoritatea scopurilor de testare, sunt preferabili itemii cu dificultatea 50%. Indicii 
de discriminare care favorizează acest nivel de dificultate vor fi adecvati pentru selecţie. 


Relaţia dintre valoarea maxima a lui „D" şi dificultatea itemilor: 
Tabelul nr. 3 


Procentul de Valoarea maximă 
reuşită la item alui D 
Ooo olo | 0 | 


100 
es es | =] 
EEE: eae 


50 100 
— 320 00 | 
0 | O | 


8.2.2. TEORIA RĂSPUNSULUI LA ITEM (T.R.L.) 
În literatura de specialitate teoria răspunsului la item nu este considerată o teorie în adevăratul sens al 
cuvântului, ci o colecție de modele şi metode statistice cu ajutorul cărora se dă un sens datelor 
provenite din măsurători psihologice(Albu, M., 1998). 


Teoria răspunsului la item a fost denumită şi teoria trăsăturii latente şi teoria curbei caracteristice 
(TCC). Aspectul fundamental al acestei abordări este faptul că performanţa la item este legată de 
cantitatea estimată de „răsătură latentă" a celui care răspunde, reprezentată prin O(7heta). Denumirea 
de trăsătură latentă se referă la un construct statistic (ceea ce nu implică automat că ar exista o entitate 
psihologică sau fiziologică corespunzătoare, cu o existenţă independentă). De exemplu, în testele 
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cognitive, trăsătura latentă este reprezentată, de obicei de abilitatea măsurată de test, iar scorul total la 
test este considerat adesea ca reprezentând o estimare iniţială a acestei abilități. 
Diferite modele T.R.I. utilizează diferite funcţii matematice, bazate pe seturi de presupuneri diferite, 
dar rezultatele obţinute prin aceste modele sunt substanţial asemănătoare. 

T.R.I. are la bază următoarele trei postulate: 

I. Comportamentul unui subiect la un item al unui test poate fi prezis cu ajutorul unui set de 
factori, denumiți trăsături latente (orice construct inobservabil, presupus continuu, despre 
care o teorie psihologică afirmă că deosebeşte persoanele între ele poate ti privit ca factor, 
iar fiecărui factor i se asociază o variabilă cu valori numerice între - infinit şi + infinit, 
denumită variabilă latentă). 

II. Putem afirma existenţa unui factor doar după ce se observă că răspunsurile la itemii prin care 
se doreşte măsurarea constructului, covariază. 

III. Relaţia dintre performanţa la item a subiecţilor şi fiecare dintre trăsăturile care au legătură cu 
performanţa poate fi descrisă prin câte o funcţie crescătoare, denumită funcţie caracteristică a 
itemului sau curbă caracteristică a itemului. Funcţia arată cum depinde probabilitatea de a 
răspunde corect la item de nivelul trasaturii. 

O trăsătură nu poate fi nici observată, nici măsurată direct. Evaluarea ei cantitativă este indirectă, 
prin intermediul unor variabile observabile (de exemplu, răspunsul la itemii unui test) despre care se 
presupune că reprezintă adecvat variabila latentă. 

Operarea cu variabile latente presupune următoarea procedură în trei etape: 

1. Definirea variabilei latente în termeni operationali sau construirea variabilei. Acest pas 
cere identificarea acelor diferenţe individuale care fac posibilă reprezentarea fiecărui individ 
printr-un punct pe axa reală (variabilă unidimensională). Dacă reprezentarea cere 
utilizarea unui spaţiu cu mai multe dimensiuni, variabila este multidimensională. 

2. Definirea situaţiilor controlabile (crearea cadrului de observaţii). Situatiile sunt reprezentate 
de itemii testului, iar rezultatul observaţiilor este exprimat numeric prin scorul la test. 

3. Alegerea modelului matematic pentru obținerea variabilei latente pe baza valorilor 
variabilelor. Modelul matematic ales trebuie să transforme o mulțime discretă în mulțimea 
numerelor reale. Variabilele latente apar în două tipuri de modele prin care sunt reprezentate 
legăturile dintre variabilele psihologice: modele care măsoară cauzele unde se presupune că 
variabila latentă este cauza variațiilor variabilelor observate; modele care măsoară efectele 
care presupun că variabila latentă este cauzată de variabilele observate. 

Dacă se utilizează mai multe instrumente de măsură (variabile observate) pentru investigarea aceleiaşi 
variabile latente, se presupune că în spatele covariatiilor existente între variabilele observate stau relaţiile 
dintre ele şi variabila latentă pe care o măsoară. Acest fapt stă la baza utilizării analizei factoriale ca 
metodă care permite determinarea valorilor unuia sau mai multor factori (variabile latente) pornind de la 
mai multe variabile observate (teste). 
In situaţia itemilor dihotomici, putem ilustra consecinţa T.R.L presupunând, de exemplu, că toți itemii 
testului măsoară aceeaşi variabilălatentă unidimensională. T.R.I. impune, în această situaţie, ipoteza 
unidimensionalitatii spaţiului variabilelor latente, respectiv faptul că nu există o altă variabilă latentă, 
pe lângă cea specificată, care să influenţeze scorurile itemilor. Această ipoteză asigură îndeplinirea 
condiţiei de independenţă locală a itemilor, care cere ca modul în care o persoană răspunde la un item 
să nu fie influenţat de felul cum a răspuns la ceilalţi itemi. Conform T.R.I., se va construi, pentru 
fiecare item al testului,functia caracteristică a itemului care leagă valorile variabilei latente măsurate 
de item cu scorurile obținute la test, respectiv P(y): R - > [0,1]. Probabilitatea ca o persoană având 
nivelul variabilei latente măsurate de item egală cu y să răspundă corect la item, pentru orice valoare a 
lui y aparţinând realului. Cu ajutorul acestei funcții se pot aprecia calitățile itemului, respectiv 
dificultatea şi puterea de discriminare, iar graficul acestei funcţii vizualizează comportarea itemului ca 
instrument de măsură. T.R.I. introduce ipoteza că funcţia P este crescătoare. Daca itemul este un 
instrument bun de măsură, un subiect care are un nivel mai înalt al variabilei latente va avea şanse mai 
mari de a rezolva corect itemul decât cel care are un nivel mai scăzut. 

Scopul teoriei răspunsului la item este de a elabora metode de estimare a valorii variabilei 
latente la subiecţii testati şi metode de estimare a caracteristicilor itemilor testului, pe baza 
răspunsurilor dale de subiecți la itemi. 
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9. ETALONAREA SI REETALONAREA TESTULUI 


9.4. Norme: definiţii 
9.5. Eşantionul normativ, cerinţe privind esantionarea 
9.6. Tehnici de normare 


9. 1. NORME: DEFINIȚII 
Obiectivul major al metodei statistice în psihodiagnoză este acela de a organiza şi sistematiza datele 
cantitative pentru a permite o interpretare obiectivă şi clară. Rezultatul, nota brută obținută la test pentru a 
putea fi interpretată, trebuie să aibă sens şi consistenţă. 
Normele reprezintă performanţele realizate la testare de către un eşantion luat ca model; astfel, 
normele sunt stabilite empiric - prin determinarea a ceea ce se poate obţine prin testare din partea 
unui grup reprezentativ (raportăm fiecare rezultat individual la rezultatele obţinute de eşantionul 
standard ca să putem spune cum se încadrează individul în cadrul rezultatelor populaţiei - dacă 
acestea coincid cu rezultatele medii ale grupului, sunt sub acestea sau peste acestea). 
Pentru determinarea exactă a locului persoanei în această distribuţie de scoruri, rezultatul este transformat 
într-o unitate de măsură normată. Aceste valori derivate au un scop dublu: 
e precizează locul individului fata de alti indivizi din eşantion; 
e permit compararea între rezultatele individuale la diferite teste. Există modalităţi diferite de a 
transforma rezultatele brute la un test pentru a corespunde celor două scopuri. 

e in general, rezultatele derivate sunt de trei tipuri: 

o norme de vârstă, 

o percentile şi 

o scoruri standard 


9.2. EŞANTIONUL NORMATIV. CERINŢE PRIVIND ESANTIONAREA 
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Orice normă se limitează la o populaţie normativă pe baza căreia a fost derivată; cel care foloseşte 
testul şi modul de normare trebuie să cunoască modul cum s-au stabilit aceste norme. In testarea 
psihologică, normele nu au valoare permanentă şi absolută, ci reprezintă performanţa la testare a 
subiecţilor care constituie eşantionul de normare. In alegerea eşantionului, efortul este de a stabili un 
grup reprezentativ Şi variat pentru populaţia căreia îi este destinată proba. In alegere se fac eforturi 
pentru reprezentativitate. Există o serie de factori care fac ca eşantionul să nu fie reprezentativ. Legată 
de problema reprezentativitatii este aceea de a defini populaţia specifică la care se aplică normele. In 
mod ideal, ar fi necesar să se definească populaţia pe baza obiectivelor testului, dar sunt dificultăți 
practice în obţinerea subiecţilor care fac irealizabil acest deziderat. 

In practică, marea majoritate a testelor nu sunt standardizate pe populaţii extinse. Eşantionul pentru 
normare trebuie să fie suficient de mare pentru a asigura valori stabile, astfel încât un alt eşantion 
extras din aceeaşi populaţie să nu producă norme care să difere semnificativ. Se cere ca un alt eşantion 
din aceeaşi populaţiei să nu producă rezultate diferite de rezultatele eşantionului iniţial. 

Normele specifice, cel mai des întâlnite în practică, constituie standardizarea testelor pe o populaţie 
atent definită, aleasă pentru a se potrivi scopurilor specifice ale fiecărui test. In astfel de cazuri se vor 
raporta clar la norme limitele populaţie informative, specificându-se restrictia în aplicare. Pentru 
diversele scopuri ale testării sunt necesare norme foarte specifice. 

în practică, chiar când există norme reprezentative pentru o populaţie definită în linii generale, sunt 
construite şi utilizate şi norme de subgrup. Acest lucru se întâmplă mai ales când subgrupele produc 
diferenţe suficient de mari la test (exemplu, populaţia uzinală dintr-un sector faţă de alt sector, o arie 
geografică fata de alta). Subgrupele se pot constitui în funcție de criterii precum: vârsta, fundalul 
cultural şi social, tipul de programe şcolare, sexul, regiunea geografică, mediul rural sau urban de 
provenienţă etc. Modul de utilizare a testului determină în ultimă 

instanţă tipul de diferențieri - criterii în funcție de care utilizăm norme generale sau particulare. 


Un caz particular este cel al normelor locale, produse când testul este folosit pentru un anumit mediu 
specific. Grupurile de normare folosite vor fi deosebit de minuţios pregătite şi definite. 


Grupul fix de referință. Un tip de scală normativă utilizează un grup de referinţă fix pentru a 
putea asigura compatibilitatea şi continuitatea rezultatelor tară a asigura şi evaluarea normativă a 
performanţei. In astfel de situaţii, rezultatul individual va depinde de caracteristicile grupului testat într-o 
anume situaţie. Scalele constituite pe baza unui grup fix de referinţă sunt analoge celor de măsurători fizice. 

Există şi situaţii mai speciale, când domeniul de referinţă nu este o populaţie de persoane, ci un 
domeniu al conţinutului. Acest tip de scale normative dau sens conținutului rezultatelor, iar norma este 
definită ca un număr ce indică procentul unui eşantion organizai dintr-un domeniu definit de probleme pe 
care individul le-a rezolvat corect, de exemplu, mărimea vocabularului unei persoane. 

Facem o diferenţă între eşantion care se referă la grup efectiv de oameni testati, şi populaţie - care 
reprezintă tipul de indivizi din care este selectat eşantionul pe baza criteriilor de reprezentativitate. De 
exemplu, în încercarea de a defini criteriile pentru elaborarea unui eşantion pentru o populație 
reprezentativă pentru elevul de liceu, ne putem întreba: 

Cum să definim populaţia specifică la care se aplică normele: pe baza obiectivelor testului? Ce tip? Se 
aplică unor absolvenţi de liceu sau unui anumit nivel de dezvoltare a personalităţii în adolescenţă? 
Normele să fie semnificative pentru nivelul de vârstă şi cu aplicabilitate internă? Lărgită la nivelul unui 
oraş? La nivelul unei regiuni sau al întregii populaţii? Ideal este pentru un test să fie construit şi normat pe 
baza unui eşantion din populaţia generală a unei tari: cu considerente legate de sex, vârstă, formare 
culturală, clase, diferenţe sat - oraş etc. (vezi date de recensământ). 


Etalonarea este una dintre etapele acţiunii de standardizare a testului. Înseamnă construirea 
etaloanelor(a normelor). 
Ea se desfăşoară în următorii paşi: 

(1)Se defineşte populaţia pentru care se etalonează testul. 
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(2)Se extrage un eşantion din această populaţie. 

(3)Se administrează testul acestui eşantion. 

(4)Se determină formula de obţinere a cotelor transformate dinscorurile testului. 
În continuare vom detalia conţinutul celor patru paşi. 
(1) Când se construieşte un test, este important să se decidă cine sunt persoanele care vor fi examinate 
cu el, ce caracteristici are cel mai mare grup din care vor proveni ele. Acesta reprezintă populația 
căreia ii este destinat testul. Definirea populaţiei se poate face fie concret, prin enumerarea tuturor 
membrilor ei, fie operaţional, prin indicarea unui set de reguli care vor permite să se cunoască, pentru 
orice persoană, dacă aparţine sau nu populaţiei. 
De exemplu, populaţia poate fi formată din "toate persoanele care au vârsta cuprinsă între 14 ani 
impliniti şi 18 ani neîmpliniţi, care locuiesc în oraşul Bucuresti şi sunt elevi la liceu". 
Definiţia populaţiei pentru care se face etalonarea unui test este foarte arbitrară: toți indivizii sau 
numai un lot cu acelaşi nivel şcolar sau de aceeaşi vârstă, dintr-un oraş, o regiune sau o ţară. 
(2) Din populaţie se va extrage un eşantion de indivizi -numit grup de normare-căruia i se va 
administra testul, pentru a stabili normele. 
Este important ca în esantionul format testul să se comporte la fel ca în întreaga populaţie: să 
măsoare sau să prezică aceeaşi variabilă, iar repartiţia scorurilor la test în eşantion să fie asemănătoare 
celei care s-ar obţine dacă s-ar dispune de scorurile întregii populaţii. 
Pentru aceasta, eşantionul constituit trebuie să îndeplinească două cerinţe: 
esa fie reprezentativ pentru populaţia din care a fost extras (structura sa să fie asemănătoare structurii 
populaţiei, în privinţa zonelor geografice şi a mediului de domiciliu, a nivelului socio-economic, a 
vârstei şi a altor caracteristici pe care autorul testului le consideră importante şi care ar putea influenţa 
rezultatele testului); 
esă fie destul de mare, aşa încât rezultatele obţinute la test să reflecte repartiţia acestor valori în 
populaţia din care provine. 


Obţinerea unui eşantion 
Se poate face prin selecţie aleatoare simplă sau prin selecţie aleatoare stratificată. 

a. In primul caz, fiecare membru al populaţiei are şanse egale de a intra în componenţa 
eşantionului. Dacă eşantionul este numeros, atunci în el se vor găsi persoane aparţinând tuturor 
zonelor geografice, claselor sociale, naționalităților prezente în populaţie, cu aceeaşi frecvenţă relativă 
ca în populaţie, deci eşantionul va fi reprezentativ pentru populaţie. 

b. Atunci când volumul eşantionului este mic, pentru obţinerea unui eşantion reprezentativ este 
necesar să se facă o selecţie aleatoare stratificată. 

În acest Scop: 

1. Se determină variabilele de mediu (sex, vârstă, rasă, clasă socială, nivel educational etc.) care 
au o influenţă mare asupra rezultatelor aplicării testului. 
2. Se face apoi o clasificare a populaţiei după valorile acestor variabile şi 
3. Se stabileşte care trebuie să fie compoziţia eşantionului astfel încât fiecare clasă să fie 
reprezentată în eşantion proporţional cu frecvenţa ei relativă în populaţie. 
4. Din fiecare clasă se extrag, prin selecţie aleatoare simplă, persoanele care vor intra în 
componenţa eşantionului. 
Principala dificultate în cazul selecţiei aleatoare stratificate constă în deteminarea variabilelor 
după care se face împărțirea în clase. Se recomandă (Kline, 1993) ca ele să se aleagă dintre variabilele 
care corelează semnificativ cu scorurile testului. Numărul lor nu va fi prea mare, pentru a nu se forma 
prea multe clase, ceea ce ar necesita alcătuirea unui eşantion foarte numeros. In general nu se aleg mai 
mult de patru variabile. Frecvent, variabilele după care se face clasificarea sunt sexul, vârsta şi clasa 
socială. 
Volumul eşantionului se stabileşte astfel încât din fiecare clasă să se extragă cel puţin 300 de 
persoane (Kline, 1993, 2000). Se deduce de aici că populaţiile generale, care sunt eterogene şi din 
acest motiv necesită utilizarea mai multor variabile pentru formarea claselor, impun obținerea unor 
eşantioane foarte numeroase. Pentru a se face economie de timp şi de bani, adesea se renunţă la 
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stabilirea normelor pentru o populaţie generală şi se utilizează populaţii mai puţin numeroase şi mai 
omogene, pentru care eşantioanele pot fi de volum mai redus. în acest fel se obţin norme locale ale 
testului. 
Dacă se constată că un subgrup al eşantionului, care poate fi identificat printr-o valoare a unei 
variabile de mediu (de exemplu "femei" sau "persoane din mediul urban") realizează la test scoruri 
mult mai mari sau mult mai mici decât restul eşantionului, se vor determina norme ale subgrupului şi 
acestea vor fi folosite în practică atunci când persoanele al căror scor trebuie interpretat au aceeaşi 
valoare a variabilei de mediu ca şi subgrupul. 
(3)Dacă eşantionul are un volum foarte mare ori este format din persoane care domiciliază sau 
lucrează în locuri diferite, testul nu poate fi administrat deodată tuturor indivizilor. Examinarea cu 
ajutorul testului se va face pe subgrupe. Dar, pentru ca rezultatele să nu fie distorsionate, condiţiile de 
administrare trebuie să fie identice pentru toate subgrupele. 
(4)În urma analizei scorurilor realizate la test de persoanele din eşantion se stabilesc normele testului. 
Apoi se determină modul în care se obţin cotele transformate din cotele brute. În acest scop se folosesc 
mai frecvent două tipuri de transformări: 
e transformări liniare, care schimbă doar media şi abaterea standard a rezultatelor, păstrând 
nemodificată repartiţia cotelor, deci ordinea indivizilor din eşantion. Prin astfel de transformări se 
obţin cotele standard z şi cotele standardizate; 
° transformări neliniare, sau transformări de arie, care schimbă repartiția cotelor brute, facând-o 
să semene cu repartiția uniformă (în cazul centilelor, decilelor sau al cuartilelor) ori cu cea normală 
(în cazul când se urmăreşte obținerea unei scale normalizate cu 5, 7 sau 9 trepte). Acest fel de 
transformări schimbă unitatea scalei, astfel încât frecvența relativă a cotelor brute care ocupă un 
interval de valori particular va fi egală cu aria suprafeței cuprinsă între intervalul transformat, desenat 
pe axa absciselor, şi: 

e curba repartiției uniforme, pentru rangurile centile, decile şi cuartile 

sau 

e curba repartitiei normale, pentru clasele scării normalizate. 
Cotele transformate rezultate prin transformări liniare sau neliniare indică poziția relativă a subiectului 
într-o populație. 
Un alt tip de transformări utilizate în etalonare sunt cele care conduc la clase echivalente sau la vârste 
echivalente. Ele se aplică pentru teste care măsoară variabile fiziologice sau psihologice ale căror 
valori cresc cu vârsta (de exemplu înălțimea, greutatea, bogăția vocabularului, performanța la citire 
etc). Aceste cote transformate descriu performanța subiectului sub forma indicării unei populații a 
cărei mediană sau medie a cotelor brute este aproximativ egală cu cota brută a persoanei respective. 
Unele teste de inteligență utilizează pentru interpretarea scorurilor, în locul vârstelor echivalente, 
normele de vârstă mintală. 


Observaţie: în România nu există norme generale bazate pe eşantioane pe întreaga populație a 
țării; în SUA, testele Minnesota, Weschler, California, testele educaţionale au fost construite pe baza 
eşantioanelor reprezentative pentru întreaga populaţie a ţării. La noi Testul California s-a lucrat şi s-au 
obținut normări doar pe loturi nereprezentative din armată, industrie, populaţia de studenţi; la Cluj, H. 
Pitariu a construit un etalon pentru populaţia Transilvaniei. Nu există date de eşantionare a populaţiei 
generale a ţării. Norme generale de interpretare s-au realizat doar pentru testul screening Denver. 

In restul situaţiilor s-a lucrat cu norme specifice, obţinute pe eşantioane foarte limitate la grupuri de 
vârste, nivel intelectual, profesii, zone, unități industriale sau şcolare etc. 

O altă problemă este cea a testelor de personalitate care au norme străine şi astfel dau diferenţe în 
interpretare, diferente de structură mentală şi culturală de care trebuie să ţinem seama. 


9.3. TEHNICI DE NORMARE 


1. Normele pe nivele de vârstă 
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Conceptul de vârstă mentală a fost introdus în revizia scalelor Binet-Simon în 1908. Probele 
individuale sunt grupate pe nivele de vârstă. De exemplu, probele pe care majoritatea copiilor de 8 ani 
le-au putut rezolva au fost cuprinse în testul dedicat pentru 8 ani. Rezultatul unui copil la acest test va 
corespunde celui mai înalt nivel de vârstă pe care este în stare să îl rezolve. Dacă un copil de 8 ani 
reuşeşte la probele cuprinse pentru nivelul de 10 ani, vârsta sa mentală este de 12, deşi cea cronologică 
este de 10. Este, deci, cu 2 ani înaintea vârstei sale, realizând performanţele unui copil de 10 ani. 
Rezultatele medii obținute de copii în cadrul grupelor de vârstă reprezintă normele de vârstă pentru un 
astfel de test. 

Dar acest gen de normare - ca normă în sine - corespunde foarte mult empiricului şi mai puţin 
statisticii. Pentru că, în practică rezultatele realizate de individ la teste, scale de vârstă de acest tip 
prezintă un grad de împraştiere destul de mare. Dacă un subiect are reuşite superioare vârstei sale 
pentru o serie, poate nu reuşeşte pentru altele, care sunt sub nivelul său de vârstă. Se introduce 
conceptul de vârstă de bază - nivelul cel mai înalt până la care se pot rezolva testele, mai jos de care 
toate testele pot fi corect rezolvate. 

Un copil poate avea nivelul de bază pentru 11 ani, dar în plus există dimensiuni de performanţă 
exprimate în luni, care se adaugă la dimensiunea de bază - pentru acele teste care prezintă nivel de 
vârstă imediat supraordonat (dacă subiectul a reuşit la toate pentru 11 ani - are 
11 ani, dar a mai reuşit şi din cele pentru 12 ani la câteva are 11 ani şi 2, 4, 9 luni, funcţie de câte peste 
11 ani a reuşit). 

Copilăria şi pubertatea sunt perioade în care inteligența poate fi scalată pentru că este în dezvoltare. 
Unitatea de vârstă mentală nu rămâne constantă cu vârsta, ci, o dată cu înaintarea în vârstă, tinde să se 
micşoreze. Un copil care la 4 ani este în retard cu aproximativ un an, când va împlini vârsta de 12 ani el se 
va afla în retard cu 3 ani. Un an de dezvoltare mentală la 3-4 ani este echivalent cu 3 ani de dezvoltare 
pentru vârsta între 9-12 ani. 

Dezvoltarea mentală progresează mai rapid la vârste mici şi mai lent la vârste mai mari; pe măsură ce 
persoana se apropie de anii de maturitate unitatea de vârstă mentală se va micşora şi ea o dată cu vârsta. 
Unitatea de vârstă mentală nu rămâne constantă cu vârsta, ci tinde să se micşoreze pe măsură ce se 
înaintează în vârstă. Pentru a permite o interpretare uniformă, indiferent de subiect sau de vârstă, a fost 
introdus coeficientul de inteligenţă, Q.I. Stern şi Kuhlman sunt primii care subliniază necesitatea 
introducerii acestui sistem de măsurare, care a fost în practică utilizat prima dată pentru scalele 
Stanford-Binet. 

Q.I.-ui reprezintă raportul dintre vârsta mentală şi cea cronologică, fractia fiind multiplicată cu 100. 

Dacă vârsta mentală este aceeaşi cu vârsta cronologică, coeficientul de inteligenţă = 100. Rezultatul, 
reprezentat printr-un coeficient sub 100, indică gradul de distanţă fata de normal; ca şi cel peste 100, 
reprezentând avansul fata de normal. Pentru a putea compara direct valorile Q.I. la vârste diferite, deviația 
standard nu trebuie să varieze în funcție de vârstă. Condiţia presupune ca valorile deviatiei standard a 
vârstei mentale să crească proportional cu vârsta. Folosirea normelor de tip Q.I. trebuie precedată de o 
verificare atentă a variabilitatii întâlnită la diferite vârste pentru a asigura condiţia de variabilitate uniformă 
a deviatiei standard sau a creşterii proporţionale a vârstei mentale. 

O altă limitare a rezultatelor normate în funcție de vârstă este legată de faptul că nu pot fi utilizate decât 
pentru acele funcţii psihice care prezintă o schimbare clară şi consecventă o dată cu vârsta. Trăsăturile 
psihice care au o slabă legătură cu vârsta nu pot fi măsurate cu astfel de norme. 


2. Normele exprimate prin percentile 
Percentilul se referă la procentul de persoane dintr-un eşantion standard care se situează sub un rezultat 
dat. Dacă 30% dintre subiecţi rezolvă mai putin de x itemi corect, acest rezultat neprelucrat, x, va 
corespunde celui de al 30-lea percentil. Gama de percentile este între 1 şi 99 şi reprezintă procentul de 
persoane din grupul de normare care au scoruri la nivelul sau sub nivelul unui anumit scor. Un 
percentil indică populaţia relativă pentru individ dintr-un eşantion standard. Percentilele pot fi 
considerate ca ranguri într-un grup de 100 de subiecţi. 
Modul de aflare a percentilelor: 
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Se socotesc toate scorurile cu valori mai mici decât scorul care ne interesează; se împarte la numărul total 
de scoruri; se inmulteste cu 100. In rangul de percentile, scorul mediei este percentila 50, P 50, ca 
măsură a tendinței centrale. Percentilele peste 50 reprezintă, succesiv, realizări deasupra mediei, iar cele 
sub 50, realizări inferioare. Percentilul 25 şi percentilul 75 sunt denumite primul şi al treilea quartil 
(sfert), delimitând sferturile inferior şi superior ale distribuţiei scorurilor în populaţia de referinţă. 
Rezultatul neprelucrat inferior oricărui rezultat din eşantionul standard şi rezultatul superior oricărui rezultat 
din eşantionul standard vor avea rangul PO şi, respectiv, P 100. Exprimarea semnificației scorului este 
de genul: Scorul persoanei este mai mare decat ex. 50%, 55%, 38% etc. dintre scorurile obţinute de 
celelalte persoane. 
Avantajele rezultatelor exprimate în percentile: 

- sunt usor de evaluat şi au sens şi pentru nespecialisti; 

- pot fi folosite şi pentru adulți şi pentru copii, şi pentru orice tip de iest. 
Dezavantajul principal constă în inegalitatea evidentă dintre unităţi, mai ales în zonele extreme ale 
distribuției (diferenţele dintre rezultatele brute sunt exagerate prin transformarea în procente; diferenţele 
dintre rezultatele aflate în apropierea extremităților sunt mult mai reduse). 


3. Norme/scoruri standard 
Rezultatele standard se pot obţine prin transformări lineare sau prin transformări nelineare ale rezultatelor 
brute. 
Când se obţin prin transformare lineară, ele vor păstra relaţiile numerice exacte ale rezultatelor brute, 
deoarece sunt obţinute prin scăderea unei constante din flecare rezultat brut şi, apoi, împrăştierea 
rezultatelor conform altei constante. Într-un astfel de model, mărimea relativă a diferenţelor dintre 
rezultatele standard derivate va corespunde exact celei dintre rezultatele brute şi toate proprietăţile 
distribuţiei inițiale a rezultatelor brute vor fi reproduse în distribuţia rezultatelor standard. 
Tipuri de scoruri standard 
1. Cotele Z 
Rezultatele derivate linear se numesc şi rezultate standard sau rezultate Z. Calcularea cotei Z cere 
scăderea din rezultatul brut al persoanei a mediei grupului normativ şi împărțirea acestei diferenţe la 
abaterea standard a grupului. Orice rezultat brut egal cu media va avea valoarea lui z = 0. Abaterea 
standard este în cazul cotelor Z egală cu 1. Formula notelor Z este următoarea: 


unde: x,= scorul brut, x = media scorurilor brute, o = abaterea standard a scorurilor brute 


Avantaj: între rezultatele Z avem aceeaşi distanţă. 
Dezavantaj: în situaţia în care media e mai mare ca rezultatul, rezultatul e negativ. 


2. Cotele de tip T si cotele de tip H 

Au intervenit pentru a facilita exprimarea rezultatelor sub medie, pentru a elimina rezulatele exprimate 
negativ. 

In cotele T, se consideră că distribuţia are media 50 şi abaterea standard 10; în practică, scara T are limitele 
între 15 şi 8. 


3. În cotele Hull, 
Media este 50, abaterea standard 14, iar formula de calcul devine: 
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In mod artificial s-a introdus valoarea unei abateri standard de 14 în loc de 10. Pentru normare se 
calculează media, abaterea standard, apoi scorul brut se transformă în scor standard - cu un continuum 
standardizat ce se întinde de la 0 la valoarea maximă. Mai există şi alte tipuri de scoruri standard, însă 
cele trei sunt cele mai folosite. 


Clasele normalizate 
Un motiv principal al acestei proceduri constă în faptul că cele mai multe distribuții ale rezultatelor brute, 
mai ales pentru teste de abilităţi, sunt aproape de curba normală a lui Gauss. 
Rezultatele standard normalizate sunt rezultate standard exprimate în termenii unei distribuții ce a fost 
transformată pentru a se potrivi curbei normale de distribuţie. 
Repetăm proprietăţile curbei normale de distribuţie: 
]. Această curbă are proprietăți matematice care se pot constitui ca o curbă de rezultate 
statistice; 
2. Scăderea rezultatelor se face pe un pas egal şi treptat spre cele două sensuri, pe măsură ce 
ne apropiem de extreme; 
3. Simetria bilaterală - având un singur vârf la mijloc. 


Există diferite modalități de a normaliza: 
1. împărțirea acestei curbe în 5 clase normale; 
2. împărţirea acestei curbe în 7 clase normale; 
3. împărțirea acestei curbe în 9 clase standard (stanine); 
4. împărțirea în 11 clase standardizate. 
Paşii procedurii includ: 
Calcularea tabelului de frecvenţe şi împărţirea lotului de subiecţi în unităţi procentuale egale, respectiv 
intervale între repere care nu sunt echidistante. 
Procente pentru fiecare clasă 
Etalonul constituit 5 clase normalizate are ca procente: 1) 6.7%, 2) 24,2%, 3)38.2%, 4)24.2% şi 5)6.7% 
dintre subiecţii lotului de referință. 
Etalonul în 7 clase normalizate: 1)4.8%, 2)11.1%, 3)21.2%, 4)25,8%, 5)21,2%, 6)11,1% si 7)4.8% 
Etalonul in 9 clase (staninele) are ca procente: 1)4.0%, 2)6.6%, 3)12.1%, 4)17.5%, 5)19.6%, 6)17.5%, 
7)12.1%, 8)6.6%, 9)4.0%. 
Etalonul in 11 clase (de obicei util pentru testele de personalitate): 3.6%, 4.5%, 7.7%, 11.6%, 14.6%, 
16.0%, 14.6,11.6%, 7.7%, 4.5%, 3.6%). 
Acest tip de transformări nonlineare se efectuează numai când există un eşantion numeros şi 
reprezentativ şi când deviația standard de la rezultatele testelor se datorează defectelor testului şi nu 
caracteristicilor eşantionului sau altor factori care afectează eşantionul. Când distribuţia reală a 
rezultatelor brute se apropie de curba normală de distribuţie, rezultatele standard derivate linear şi 
rezultatele standard normalizate vor fi aproape identice. în astfel de situaţii, rezultatele standard şi 
clasele normalizate vor servi aceluiaşi scop. Reproducem mai Jos echivalentele între diferitele tipuri 
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Comparatii a diferite tipuri de scoruri la test: 


Dă un număr precis de puncte 


scor brut obţinute la test 


Este mai uşor înţeles de 
utilizatori. 

Nu cere statistici sofisticate. 
Indică o poziţie relativă a 
scorurilor în percentile. 


Mai adecvat pentru datele fără 
distribuţie normală (distribuții 
asimetrice). 


Scorurile sunt unitare. 
Poate fi exprimată tendinţa 
centrală. 

Simple şi utile. 


Derivate din proprietăţile 
curbei normale. Reflectă 
diferenţele absolute dintre 
scoruri. Se poate calcula 
tendinţa centrală şi corelatia. 
Dacă grupele de referință sunt 


scoruri 
standard 


echivalente, permit compararea 


de la test la test. 


Nu poale fi interpretat sau comparat 


Utilizează unităţi de măsurare ordinale; 
utilizează deci unităţi inegale de 
măsurare. 

Nu permite o tendinţă centrală. 

Nu poate fi comparat dacă grupele nu 
sunt similare. 

Distorsionează mult diferenţele de scor în 
partea de sus şi de jos a distribuţiei. 

Se poate ajunge să nu permită suficiente 
unităţi de scor pentru a putea să 
diferentiezi printre scoruri. 

Sunt insensibile la diferenţele de mărime 
din cadrul staninei. 


Inadecvate pentru datele ce nu se 
grupează conform curbei normale. 
Sunt dificil de explicat pentru utilizatori. 
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10. APLICAREA TESTULUI SI INTERPRETAREA REZULTATELOR 


10.1.Relatia test - obiective investigate; factori ce intervin în testarea 
psihologică 

10.2.Testarea şi sursele variaţiei erorii 

10.3.Cerinţe privind conduita utilizatorului de teste 

10.4.Raportul-caracterizarea finală 


10.1. RELAȚIA TEST-OBIECTIVE INVESTIGATE. FACTORI CE 
INTERVIN IN TESTAREA PSIHOLOGICA 


Testele psihologice evaluează fie atribute psihice, fie pot servi predictiei unor 
comportamente. Testul constă din una sau mai multe probe care determină flecare o 
reacție psihologică, comportamentală a subiectului sau îi cere să evalueze un 
comportament propriu sau al altuia. Raspunsurilor, conform unor reguli fixe, li se atribuie 
valori numerice, denumite scoruri. 

Un item al testului, respectiv situaţia stimul care solicită un astfel de răspuns sau 
reacție din partea subiectului, poate consta dintr-o întrebare, un desen, o problema 
situationala, o listă de alegere sau ordonare- răspunsului subiectului atribuindu-i-se un 
scor. Un set de itemi omogeni, care se referă la acelaşi aspect psihic, formează o scală. 
Pentru fiecare scală se calculează scorul pe baza itemi lor componență, conform unor 
reguli. Nu există restricții privind numărul de itemi care formează o scală. Nu este 
necesar ca itemii unui test construit în scopul diagnosticului sau predictiei unui 
comportament să descrie exact acel comportament. 

De exemplu, pentru selecția profesională ar fi imposibil ca un test să se refere la 
totalitatea situaţiilor şi comportamentelor profesionale specifice. Nu li se poate cere 
persoanelor ce se prezintă la examenul pentru permisul de conducere să conducă 
automobilul atâta vreme cât nu au urmat cursul de instruire. Testul psihologic măsoară 
comportamente prin care se pot face inferente asupra altor comportamente. 

Taxonomia tipurilor de itemi realizată de A. Angleitner, 1986, se referă la relaţiile 
posibile între itemul testului de personalitate şi trăsătura evaluată. Astfel, itemul poate 
descrie 7 categorii de aspecte: 

e reacțiile subiectului (deschise, comportamente observabile); reacții acoperite, 
interne (precum sentimente, cogniţii interioare); reacții psihofiziologice; 

e atribute ale trăsăturii (dispoziţii, de obicei descrise prin adjective sau substantive); 

e dorințe şi trebuinte (ca, de exemplu, intenţia de a se angaja în comportamente 
specificate); 

e fapte biografice; 

e atitudini (opinii puternic susţinute fata de diverse categorii de subiecte generale, 
sociale, personale); 
reacţiile altora (reacţii, atitudini, opinii ale altora fata de persoană); 
alte conţinuturi, uneori fără legătură aparentă. 
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Toate regulile privind caracteristicile psihometrice ale testului şi calităţile testului 
psihologic au ca obiectiv să menţină capacitatea testului de a măsura ceea ce îşi propune 


să măsoare. 


Există o serie de factori care intervin şi influenţează reacţia subiectului la 
conţinutul testului şi care astfel pot interfera cu obiectivul acestuia, cu ceea ce îşi propune 
testul să măsoare: 

I. Factori ce tin de caracteristicile stimulilor 


a. 
b. 


d. 


Conţinutul testului 

Formatul testului: în relație cu viteza de lucru, maniera de răspuns, 
uşurinţa sau dificultatea de a face faţă acestui format 

Secvența sau modelul secvențial în care se desfăşoară proba (paternul de 
succesiune a itemilor) 

Legătura culturală a caracteristicilor testului (dependenţa de cultura din 
care a făcut parte cel ce a făcut testul). 


II. Factori ce tin de caracteristicile situatiilor 


a. Modul de administrare a testului: instructaj, timp de lucru standard, tipul 
de material cu care lucreaza subiectul (standardizate) 

b. Contextul interpersonal, unde este inclusă şi influenţa examinatorului. 

c. Caracteristicile fizice: lumină, zgomot, stimuli luminosi. 

d. Contextul social: este important dacă subiectul lucrează singur sau în grup, 
dacă metoda de înregistrare a rezultatelor tine tot de caracteristicile 
situaţiilor. 

Il. Factori ce tin de caracteristicile persoanelor implicate 

a. Scopurile personale ale testării („vreau să obţin un job sau vreau să le 
demonstrez celorlalţi că pot obţine postul”). 

b. Stilurile personale de răspuns, care includ: 

II. dezirabilitatea socială (unii sunt mai legaţi de dezirabilitatea 
socială; în cadrul conţinutului va interveni acest al doilea factor, pe 
lângă 
conţinutul întrebării) 

III. complianta (se referă la comportamentul de acceptare a ceea ce li 
se cere); 

IV. apărările sociale (ale eului): când, în structura personală, unul 
dintre mecanisme devine rigid, funcţionând în toate situaţiile de 
viata, atunci devine disfunctional 

c. Caracteristici ce tin de fiziologie: sănătate, oboseală, caracteristici de 
motricitate, auz etc. 

d. Fluctuatii ale atenției şi memoriei, care pot tine de o dinamică 
inconstienta. 

e. Capacitatea de a înţelege întrebările şi itemii testului şi îndemânarea în 
lectură (citire). 

f. Starea emoţională în sine şi starea de tensiune (calm rezultat din blocarea 
tensiunii - un hipercontrol). 

g. Măsura în care subiectul este familiarizat cu testarea. 

h. Dispozitia de a avea sau nu noroc in ghicirea răspunsului (intuiţia este în 


rezonanţă profundă cu materialul). 
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i. Elemente care tin de trăsăturile de comportament, motive, conflicte. 


10.2 TESTAREA ŞI SURSELE VARIATIEI ERORII 


Înainte de a calcula coeficientul de fidelitate al unui test este necesară precizarea 
surselor posibile ale erorilor de măsură. O caracteristică a unei persoane poate fi măsurată 
prin scorurile reale ale unui test sau poate influența scorurile observate, ca eroare de 
măsură, la un alt test. Condiţiile de administrare a testului (lumina, căldura, 
zgomotul etc), când diferă de cele standardizate, pot modifica destul de mult scorurile 
observate. 

Din aceste motive, nu este suficient să se indice o valoare a coeficientului de fidelitate 
pentru a arăta cât de bine sunt reflectate scorurile reale de scorurile observate, ci trebuie 
să se precizeze: 


° caracteristicile persoanelor cărora le este destinat testul (nivel de studii, 
vârstă etc); 
. condiţiile în care se administrează testul. 


Au fost detectate mai multe surse ale variabilitatii scorurilor, sintetizate în şase categorii. 

Sursele posibile de variabilitate care pot afecta scorurile unui anumit test sunt: 
1. particularitatile durabile şi generale ale persoanei; 

particularitatile durabile, dar specifice ale persoanei; 

particularităţi temporare, dar generale ale persoanei; 

particularităţi temporare şi specifice ale persoanei; 

factori sistematici sau de noroc care afectează administrarea testului sau evaluarea 

performanţelor la test; şi, în ultimă instanţă, 

6. unele variaţii neexplicate precum şansa în găsirea răspunsului corect (subiectul 
ghiceşte) sau distragerea temporară a atenţiei (Thorndike, 1949; Murphy şi 
Davidshofer, 1991). 


vitale a dl a 


Particularitatile durabile, dar generale au influenţă asupra rezolvării mai multor teste. 
Ele pot fi: nivelul unor deprinderi ce pot influenţa nivelul de operare la teste; deprinderile 
ŞI tehnicile generale solicitate în testare; abilitatea generală de a înţelege instrucțiunile la 
teste. 


Particularitatile durabile, dar specifice au influenţă numai asupra unui test. Ele pot fi 
specifice fata de testul luat ca întreg, precum nivelul individual de dezvoltare a abilității 
respective care nu influenţează rezolvarea altor teste; cunoştinţe şi deprinderi specifice; 
modele de răspuns stabile. Pot fi, de asemenea, specifice pentru anumiţi itemi ai testului, 
precum: şansa persoanei de a şti răspunsul la un anume fapt particular cerut de item; 
tipuri de itemi cu care subiectul este anterior familiarizat. 


Particularitatile temporare, dar generale ale persoanei se referă la factori incidentali 
care afectează performanţele nu numai la un anume test, ci la mai multe sau la toate 
testele, precum: sănătatea, oboseala, motivaţia, tensiunea emoțională, nivelul prea elevat 
al testului, înţelegerea sau nu a mecanismelor testării respective, condiţiile de 
administrare. 
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Particularitatile temporare şi specifice care influențează doar un anume test pot fi 
specifice pentru testul în întregime sau faţă de anumiţi itemi ai săi. Din prima categorie 
fac parte: înţelegerea sarcinii specifice cerute de testul dat; micile trucuri sau tehnici de 
rezolvare a testului; nivelul de antrenare în rezolvarea unor anumite tipuri de sarcini; 
setul sau dispoziția momentană. Din a doua categorie fac parte fluctuațiile şi 
idiosincraziile caracteristice individului şi fluctuațiile neprevăzute ale atenţiei sau 
percepţiei suprapuse nivelului general de performanţă caracteristic persoanei. 


Dintre factorii sistematici amintim: condiţiile de testare (un anumit interval de timp 
fixat pentru testare, factori de distragerea atenţiei, claritatea instructajului); efectul 
interacțiunii personalității, sexului sau rasei examinatorului cu personalitatea celui 
examinat, care poate stimula sau inhiba performanţa; inconsecventa sau părtinirea în 
evaluarea performanţelor. 


10.3. CERINȚE PRIVIND CONDUITA UTILIZATORULUI DE TESTE 


Standardele de testare psihologică şi educaţională prevăd o serie de reguli privind 
utilizatorul de teste. Un principiu fundamental pentru examenul psihologic, indiferent de 
natura acestuia, este onestitatea ştiinţifică şi profesională a celui care examinează şi 
interpretează datele. In virtutea acestui principiu, este important ca în conduită să se evite 
complet atitudinea de „superioritate a-toate~cunoscatoare” care lasă să se înţeleagă că 
prin examinarea psihologică se ajunge să ştii totul despre persoana examinatului. Trebuie 
cunoscute şi avute mereu în vedere limitele procedurilor standardizate. 

In examinare este necesară aplicarea probelor într-o manieră realistă, rațională şi 
favorabilă pentru subiectul examinat reducându-se la minim elementele care accentuează 
stresul în situaţia de examen. 

Valoarea rezultatelor poate fi alterată semnificativ de lipsa de cooperare, de 
influenţa factorilor ce pot inhiba conduita normală a subiectului sau îl împiedică să 
realizeze nivelul de performanţă de care este în mod obişnuit capabil. Astfel de factori 
trebuie cunoscuţi de examinator şi înlăturați dintre variabilele situaţiei de examen, ca şi 
diferite atitudini ale subiectului care afectează modul său de lucru precum: teama de eşec, 
nevoia de a apărea într-o lumină favorabilă, percepții deformate privind examenul, sensul 
acestuia şi examinatorul. 

Printre condiţiile care favorizează eliminarea tensiunii şi care tin de 
comportamentul examinatorului amintim: găsirea unei poziţii în care subiectului să-i fie 
mai putin vizibile notatiile sau observaţiile, sau aparatele de înregistrare a indicatorilor de 
eroare şi timp de execuţie; în general, pentru a scădea gradul de nesiguranţă, 
examinatorul trebuie să fie vizibil subiecţilor. În conduită se cer evitate descurajările prin 
afirmarea peremptorie a erorii, dar şi confirmarea continuă a corectitudinii răspunsurilor. 
Încurajarea, necesară în relaţia cu subiectul, nu trebuie să influenţeze direcţia şi calitatea 
gândirii şi conduitei subiectului. Se cer evitate manifestările de oboseală, plictiseală, 
nemulţumire. 

Capacitatea de a face interpretări, de a înţelege natura dezadaptării sau 
insuccesului profesional sau existenţial, de a prognoza eficienţa într-o activitate cere 
psihologului o continuă perfecţionare prin cunoaşterea la zi a literaturii referitoare la 
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validitatea probelor respective şi lărgirea orizontului de cunoaştere profesională, aspecte 
care îi pot permite aprecierea corectă a metodelor la care poate recurge într-o situație 
dată, sau a acelor aspecte care trebuie adâncite în cadrul examinării. 

În profilul psiho-comportamental este important să se manifeste calităţi precum: 
cultura psihologică, experienţa interpersonală câştigată inclusiv în contactul cu diferite 
categorii de persoane, autocunoaşterea, deprinderi formate în cercetarea psihologică 
şi/sau experimentală, dar şi calități psihice precum simţul empatic, capacitatea de a obține 
cooperare, inteligenţa, sănătatea psihică. în mod specific sunt necesare memorarea 
corectă a instructajelor, deprinderea de a observa şi nota corect răspunsurile şi 
observaţiile. 


10.4. RAPORTUL-CARACTERIZAREA FINALĂ 


Forma pe care o ia acest raport este de obicei direct legată de tipul de examen şi 
de cerinţele beneficiarului. Raportul unui examen clinic diferă în amploare şi profunzime 
a interpretărilor de raportul unui examen de selecție. Raportul privind consilierea 
educaţională diferă în conţinut şi tip de centrare pe probleme de raportul de expertiză 
judiciară. Rapoartele diferă, de asemenea, şi în funcţie de nivelul de comprehensibilitate 
al beneficiarului.Conditiile şi principiile generale de întocmire a raportului sunt 
prezentate în Standardele de testare educaţională şi psihologică. Principiile respective se 
referă la obiectivitate, non-intruziunea, lipsa de ambiguitate şi subiectivism, respectarea 
confidentialitatii, neutilizarea unor termeni care nu sunt inteligibili beneficiarului şi 
explicarea semnificației rezultatelor prezente. 

O deficiență constă în descriptivismul exagerat (privind comportamentul 
subiectului în timpul examinării) fără a oferi şi comentarii asupra acestor prezentări. 
Simpla enumerare a observaţiilor făcute, fără comentarii, şi integrarea lor într-un sens 
anume, pot genera o varietate largă de interpretări ale beneficiarului, conducând cel mai 
adesea spre imagini greşite asupra subiectului, încărcate de subiectivismul celui care 
citeşte un astfel de raport. în raport se includ explicaţiile posibile, atenţionând când 
acestea nu sunt certe. în situaţia unor rezultate contradictorii este important ca psihologul 
să prezinte obiectiv constatările şi să încerce explicarea inconstantelor, incertitudinilor, 
discordantelor dintre date. 
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